AI離線數(shù)字人生成服務(wù)-AIGC

AI離線數(shù)字人生成服務(wù)-AIGC

專用API
【更新時間: 2024.07.15】 AI離線數(shù)字人是指存在于非物理世界中,基于計算機圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成、人像建模等人工智能技術(shù),創(chuàng)造出來的一個可供真人或計算機驅(qū)動的形象實體,具有對物理世界的感知、認(rèn)知與表達能力。
瀏覽次數(shù)
121
采購人數(shù)
4
試用次數(shù)
0
! SLA: N/A
! 響應(yīng): N/A
! 適用于個人&企業(yè)
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是AIGC的AI離線數(shù)字人生成服務(wù)?

AI離線數(shù)字人是指存在于非物理世界中,基于計算機圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成、人像建模等人工智能技術(shù),創(chuàng)造出來的一個可供真人或計算機驅(qū)動的形象實體,具有對物理世界的感知、認(rèn)知與表達能力,以電子屏、VR、AR等設(shè)備為載體,實現(xiàn)人機交互;通過其面向媒體、金融、會議、文旅、娛樂、教育、醫(yī)療等行業(yè),提供全新智能型服務(wù),降低人力成本,提升服務(wù)質(zhì)量和效率。在技術(shù)層面,虛擬數(shù)字人可被分為真人靈活驅(qū)動型和基于深度學(xué)習(xí)算法,智能驅(qū)動型兩類。 新華智云自主研發(fā)了真人驅(qū)動和智能驅(qū)動數(shù)字人技術(shù),結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和計算機圖形學(xué),深度鉆研聲音或視覺信息到面部及身體動作的建模和渲染,讓計算機能夠理解語音和圖像的內(nèi)容并以此精細(xì)驅(qū)動數(shù)字人形象的口唇、面部表情、頭部乃至全身的動作,生成極具逼真感的數(shù)字人視頻,進而實現(xiàn)AI驅(qū)動數(shù)字人的內(nèi)容生產(chǎn)鏈路。同時,新華智云數(shù)字人技術(shù)全方位覆蓋了包含2D仿真人數(shù)字人、2D卡通數(shù)字人、3D卡通數(shù)字人、3D寫實數(shù)字人等各個類型的數(shù)字人創(chuàng)造鏈路。 作為“懂內(nèi)容的技術(shù)公司”,新華智云將數(shù)字人技術(shù)與專業(yè)視頻編輯系統(tǒng)相結(jié)合,推出數(shù)字人大廳這款虛擬數(shù)字人的視頻編輯與生產(chǎn)平臺,為內(nèi)容生產(chǎn)者提供涉及數(shù)字人相關(guān)的內(nèi)容采集、編輯、存儲、分發(fā)等全生產(chǎn)鏈的專有技術(shù)。在國內(nèi)乃至全球的數(shù)字人技術(shù)領(lǐng)域新華智云數(shù)字人技術(shù)都處于領(lǐng)先地位。

 

什么是AIGC的AI離線數(shù)字人生成服務(wù)接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用AIGC的AI離線數(shù)字人生成服務(wù),從而實現(xiàn)程序的自動化交互,提高服務(wù)效率。

AIGC的AI離線數(shù)字人生成服務(wù)有哪些核心功能?

  1. 照片快速生成3D數(shù)字人:通過用戶提供的照片,自動進行人臉骨骼點預(yù)測,并自動化捏制3D人臉模型,生成高度逼真的數(shù)字分身。
  2. 視頻采集生成2D數(shù)字人:支持用戶上傳2-5分鐘的視頻,從中提取關(guān)鍵幀,快速生成高定2D真人數(shù)字人,同時支持定制形象、聲音和動作。
  3. 實時渲染與智能交互:提供實時渲染技術(shù),支持?jǐn)?shù)字人在多種場景下的智能交互,包括問答、表情變化、動作執(zhí)行等。
  4. 定制化服務(wù):提供豐富的數(shù)字人形象庫,并支持用戶根據(jù)需求進行定制化服務(wù),包括形象設(shè)計、聲音合成、動作捕捉等。
  5. API接口接入:提供API接口,方便用戶將生成的數(shù)字人集成到自己的應(yīng)用或系統(tǒng)中,實現(xiàn)無縫對接。

AIGC的AI離線數(shù)字人生成服務(wù)的核心優(yōu)勢是什么?

  1. 高效快速:通過自動化流程,大大縮短了數(shù)字人生成的時間,提高了效率。
  2. 高度逼真:利用先進的計算機圖形學(xué)和深度學(xué)習(xí)技術(shù),生成的數(shù)字人形象高度逼真,接近真人效果。
  3. 定制化強:提供豐富的定制化選項,滿足不同用戶的個性化需求。
  4. 易于集成:提供便捷的API接口,方便用戶將數(shù)字人集成到自己的業(yè)務(wù)系統(tǒng)中。
  5. 應(yīng)用場景廣泛:適用于媒體、金融、會議、文旅、娛樂、教育、醫(yī)療等多個領(lǐng)域,為用戶提供全新的智能型服務(wù)體驗。

在哪些場景會用到AIGC的AI離線數(shù)字人生成服務(wù)?

1.  媒體行業(yè):虛擬主播制作

在媒體行業(yè)中,AIGC技術(shù)被廣泛應(yīng)用于新聞播報、天氣預(yù)報、綜藝節(jié)目等節(jié)目的虛擬主播制作。虛擬數(shù)字主持人不僅承擔(dān)了日常新聞播報,還可進行多語種翻譯,在重要活動中進行了展示。河北廣電AIGC聯(lián)合實驗室打造的AI主持人融合了深度學(xué)習(xí)模式和高精度渲染技術(shù),實現(xiàn)了語音與表情的高度擬真效果。這些虛擬主播不僅提高了節(jié)目的制作效率,還為觀眾帶來了新穎的觀看體驗。

 

 

2.  金融行業(yè):虛擬客服與顧問

在金融行業(yè),AIGC技術(shù)的應(yīng)用體現(xiàn)在虛擬客服或虛擬顧問的角色上,它們能夠提供全天候的客戶服務(wù)或產(chǎn)品介紹。這些虛擬數(shù)字人通過自然語言處理等技術(shù),可以準(zhǔn)確理解用戶需求,并給出滿意的答復(fù)。通過AIGC實現(xiàn)金融資訊、產(chǎn)品介紹視頻內(nèi)容的自動化生產(chǎn),以及塑造虛擬數(shù)字人客服,這不僅提升了服務(wù)效率,還增強了用戶的互動體驗。

 

 

3.  教育行業(yè):虛擬教師與助教

在教育行業(yè),AIGC技術(shù)被用作虛擬教師或助教,輔助教學(xué)活動或提供學(xué)習(xí)資源。AIGC技術(shù)通過分析用戶數(shù)據(jù),為傳媒藝術(shù)領(lǐng)域提供了個性化內(nèi)容生成的可能,這在推薦系統(tǒng)和定制化服務(wù)中尤為重要。同時,AIGC技術(shù)也在教育和培訓(xùn)領(lǐng)域展現(xiàn)出巨大潛力,通過虛擬教師和模擬訓(xùn)練環(huán)境,為學(xué)生提供了更加互動和沉浸式的學(xué)習(xí)體驗,從而變革了傳統(tǒng)的教育模式。

 

 

2.  娛樂行業(yè):虛擬偶像與角色

在娛樂行業(yè),AIGC技術(shù)作為虛擬偶像或角色,參與游戲、動畫、電影等娛樂內(nèi)容的制作。AIGC技術(shù)使得虛擬偶像的創(chuàng)作變得更加簡單。虛擬數(shù)字人可以通過學(xué)習(xí)大量數(shù)據(jù)來模擬偶像的言行舉止,甚至可以根據(jù)用戶需求進行個性化表演,為用戶帶來全新的視聽體驗。一些AIGC項目開始運用在虛擬偶像二創(chuàng)領(lǐng)域,粉絲用AI作畫工具為心愛的虛擬偶像創(chuàng)作插畫甚至是cosplay,豐富衍生的圖片內(nèi)容。這些技術(shù)的進步讓虛擬偶像的二創(chuàng)跨出了一大步,不再局限于視覺,為娛樂產(chǎn)業(yè)帶來了新的可能性。

 

<
使用指南
>

開發(fā)者入門指南:離線數(shù)字人API

1. 概述

離線數(shù)字人API支持2D仿真和3D寫實數(shù)字人合成服務(wù)。本文檔將指導(dǎo)開發(fā)者如何使用該API,包括接口調(diào)用、參數(shù)說明和常見錯誤處理。

2. 域名及請求加簽

  • 請求地址: https://api.shuwen.com

  • 請求方式: GET/POST

  • 接口路徑示例: /open/digitalMan/pageQuery?pageNo=1&pageSize=10

3. 數(shù)字人列表查詢接口

3.1 接口調(diào)用

  • 請求方式: GET

  • 請求路徑: /open/digitalMan/pageQuery

  • 請求參數(shù):

    • pageNo (必填): Integer, 分頁頁碼

    • pageSize (必填): Integer, 分頁大小

3.2 接口結(jié)果

  • 返回數(shù)據(jù)結(jié)構(gòu):

    • total: 數(shù)據(jù)總量

    • data: 數(shù)字人信息數(shù)組

      • id: 數(shù)字人ID

      • name: 名稱

      • description: 描述

      • preImg: 預(yù)覽圖

4. 數(shù)字人詳情查詢接口

4.1 接口調(diào)用

  • 請求方式: GET

  • 請求路徑: /open/digitalMan/detaiQuery/

  • 請求參數(shù): 數(shù)字人ID(必填)

4.2 接口結(jié)果

  • 返回數(shù)據(jù)結(jié)構(gòu)包括:

    • voices: 數(shù)字人聲音信息

    • clothes: 數(shù)字人服飾信息

5. 數(shù)字人合成相關(guān)接口

5.1 合成接口調(diào)用

  • 請求方式: POST

  • 請求路徑: /open/digitalMan/batch/generate

  • 請求參數(shù):

    {
     "generateParam": [
      {
         "algoParam": {
           "video": {},
           "background": "背景圖URL",
           "tts": {
             "text": "合成文本",
             "per": "聲音ID"
          },
           "position": [0, 0, 1080, 1801],
           "code": "數(shù)字人編碼",
           "is_green": true,
           "subtitle": true
        }
      }
    ],
     "callBackUrl": "回調(diào)地址"
    }

5.2 合成接口結(jié)果

  • 返回任務(wù)的 groupId

5.3 合成任務(wù)查詢接口

  • 請求方式: GET

  • 請求路徑: /open/digitalMan/batch/query/

  • 請求參數(shù): groupId

5.4 合成任務(wù)結(jié)果返回

  • 返回數(shù)據(jù)包括:

    • status: 當(dāng)前子任務(wù)合成狀態(tài)

    • composeUrl: 合成視頻的URL

    • textSegs: 播報內(nèi)容的相關(guān)信息

5.5 異步回調(diào)方式

  • 客戶端需根據(jù)簽名驗證回調(diào)請求的合法性。

6. 字幕文件生成

6.1 接口調(diào)用

  • 請求方式: POST

  • 請求路徑: /open/digitalMan/subtitle/generate

  • 請求參數(shù):

    • taskId: 任務(wù)ID

    • type: 字幕類型(可選,默認(rèn)srt

6.2 合成結(jié)果

  • 返回字幕文件的URL

7. 常見錯誤碼

  • SW-DM-1000: 合成任務(wù)創(chuàng)建失敗

  • SW-DM-1001: 租戶ID缺失

  • SW-DM-1002: 主參數(shù)缺失

  • SW-DM-1003: generateParam參數(shù)缺失

  • SW-DM-1004: algoParam參數(shù)缺失

  • SW-DM-1005: 數(shù)字人形象code參數(shù)缺失

  • SW-DM-1006: tts參數(shù)缺失

8. 結(jié)語

通過以上步驟,開發(fā)者可以快速上手新華智云離線數(shù)字人API,進行數(shù)字人的查詢和合成。請根據(jù)實際需求調(diào)整參數(shù)和請求方式,確保接口調(diào)用的成功。

指南詳情鏈接:https://aigc.shuwen.com/docs/zh-cn/human/real.html

 

<
產(chǎn)品問答
>
?
什么是AI離線數(shù)字人生成服務(wù)?
答案:AI離線數(shù)字人生成服務(wù)是一種利用人工智能技術(shù),通過計算機圖形學(xué)、深度學(xué)習(xí)等手段,為用戶提供快速、高效、定制化的數(shù)字人生成服務(wù)。用戶可以通過離線方式,簡單的輸入(如照片或視頻),快速生成高質(zhì)量的2D或3D數(shù)字人形象,適用于多種應(yīng)用場景。
?
AI離線數(shù)字人生成服務(wù)的核心功能有哪些?
核心功能包括通過AI技術(shù)快速從照片生成3D數(shù)字人、利用視頻采集生成2D數(shù)字人、實時渲染與智能交互、提供定制化服務(wù)以及離線API接口接入。
?
AI離線數(shù)字人生成服務(wù)的核心優(yōu)勢是什么?
核心優(yōu)勢包括高效快速的離線處理、高度逼真的數(shù)字人形象生成、強大的定制化離線服務(wù)、易于集成的離線API接口以及廣泛的應(yīng)用場景。
?
在哪些場景會用到AI離線數(shù)字人生成服務(wù)?
應(yīng)用場景包括媒體行業(yè)、金融行業(yè)、教育行業(yè)、娛樂行業(yè)等,用于新聞播報、天氣預(yù)報、綜藝節(jié)目、虛擬客服、虛擬教師、虛擬偶像或角色等數(shù)字人的應(yīng)用。
?
如何調(diào)用AI離線數(shù)字人生成服務(wù)的API接口?
通常通過Restful風(fēng)格的API接口進行離線調(diào)用,使用公網(wǎng)HTTP協(xié)議實現(xiàn)程序的自動化交互。具體的接口調(diào)用方式和參數(shù)說明,需要參考服務(wù)提供商的詳細(xì)文檔。
?
如何創(chuàng)建圖片數(shù)字人?
通過調(diào)用創(chuàng)建圖片數(shù)字人的離線API接口,可以基于圖片創(chuàng)建數(shù)字人形象,然后進行視頻合成或其他交互。
?
AI離線數(shù)字人生成服務(wù)支持哪些語音和視覺的多模態(tài)表達?
集成自然語言理解算法,根據(jù)播報的內(nèi)容智能驅(qū)動數(shù)字人表情和動作,實現(xiàn)語音、表情、手勢動作的多模態(tài)表達,所有操作均可在離線環(huán)境下完成。
?
使用AI離線數(shù)字人生成服務(wù)時,如何保護數(shù)據(jù)隱私?
在生成和使用AI數(shù)字人的過程中,尤其是在離線環(huán)境下,要嚴(yán)格保護用戶的隱私和數(shù)據(jù)安全,避免數(shù)據(jù)泄露或未經(jīng)授權(quán)的使用。
?
AI離線數(shù)字人生成服務(wù)在教育領(lǐng)域的應(yīng)用有哪些?
AI數(shù)字人可以作為智能教育助手,為學(xué)生提供個性化的學(xué)習(xí)輔導(dǎo),提高學(xué)習(xí)效果。此外,還可以作為虛擬教師,輔助教學(xué)活動或提供學(xué)習(xí)資源,所有這些應(yīng)用都可以在離線環(huán)境中實現(xiàn)。
<
關(guān)于我們
>
元卯AIGC是一家專注于AIGC(人工智能生成內(nèi)容)技術(shù)的公司,提供包括數(shù)字人和數(shù)字內(nèi)容在內(nèi)的元宇宙數(shù)字場景服務(wù)。公司通過定制形象的數(shù)字人技術(shù),實現(xiàn)輕松播報,同時提供視頻API等數(shù)字內(nèi)容服務(wù),致力于推動人工智能技術(shù)在內(nèi)容創(chuàng)作和傳播領(lǐng)域的應(yīng)用。
聯(lián)系信息
服務(wù)時間: 0:00 - 24:00
網(wǎng)頁在線客服: 咨詢

 虛擬數(shù)字人是指存在于非物理世界中,基于計算機圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成、人像建模等人工智能技術(shù),創(chuàng)造出來的一個可供真人或計算機驅(qū)動的形象實體,具有對物理世界的感知、認(rèn)知與表達能力,以電子屏、VR、AR等設(shè)備為載體,實現(xiàn)人機交互;通過其面向媒體、金融、會議、文旅、娛樂、教育、醫(yī)療等行業(yè),提供全新智能型服務(wù),降低人力成本,提升服務(wù)質(zhì)量和效率。在技術(shù)層面,虛擬數(shù)字人可被分為真人靈活驅(qū)動型和基于深度學(xué)習(xí)算法,智能驅(qū)動型兩類。 新華智云自主研發(fā)了真人驅(qū)動和智能驅(qū)動數(shù)字人技術(shù),結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和計算機圖形學(xué),深度鉆研聲音或視覺信息到面部及身體動作的建模和渲染,讓計算機能夠理解語音和圖像的內(nèi)容并以此精細(xì)驅(qū)動數(shù)字人形象的口唇、面部表情、頭部乃至全身的動作,生成極具逼真感的數(shù)字人視頻,進而實現(xiàn)AI驅(qū)動數(shù)字人的內(nèi)容生產(chǎn)鏈路。同時,新華智云數(shù)字人技術(shù)全方位覆蓋了包含2D仿真人數(shù)字人、2D卡通數(shù)字人、3D卡通數(shù)字人、3D寫實數(shù)字人等各個類型的數(shù)字人創(chuàng)造鏈路。 作為“懂內(nèi)容的技術(shù)公司”,新華智云將數(shù)字人技術(shù)與專業(yè)視頻編輯系統(tǒng)相結(jié)合,推出數(shù)字人大廳這款虛擬數(shù)字人的視頻編輯與生產(chǎn)平臺,為內(nèi)容生產(chǎn)者提供涉及數(shù)字人相關(guān)的內(nèi)容采集、編輯、存儲、分發(fā)等全生產(chǎn)鏈的專有技術(shù)。在國內(nèi)乃至全球的數(shù)字人技術(shù)領(lǐng)域新華智云數(shù)字人技術(shù)都處于領(lǐng)先地位。早在2019年6月我方產(chǎn)品已經(jīng)投入市場使用。目前已經(jīng)有超過280家國內(nèi)機構(gòu)、覆蓋了22個省、使用我方數(shù)字人產(chǎn)品,市場成熟度高、并已應(yīng)用在媒體、文旅、會展、金融等領(lǐng)域。

<
最可能同場景使用的其他API
>
API接口列表
<
使用指南
>

開發(fā)者入門指南:離線數(shù)字人API

1. 概述

離線數(shù)字人API支持2D仿真和3D寫實數(shù)字人合成服務(wù)。本文檔將指導(dǎo)開發(fā)者如何使用該API,包括接口調(diào)用、參數(shù)說明和常見錯誤處理。

2. 域名及請求加簽

  • 請求地址: https://api.shuwen.com

  • 請求方式: GET/POST

  • 接口路徑示例: /open/digitalMan/pageQuery?pageNo=1&pageSize=10

3. 數(shù)字人列表查詢接口

3.1 接口調(diào)用

  • 請求方式: GET

  • 請求路徑: /open/digitalMan/pageQuery

  • 請求參數(shù):

    • pageNo (必填): Integer, 分頁頁碼

    • pageSize (必填): Integer, 分頁大小

3.2 接口結(jié)果

  • 返回數(shù)據(jù)結(jié)構(gòu):

    • total: 數(shù)據(jù)總量

    • data: 數(shù)字人信息數(shù)組

      • id: 數(shù)字人ID

      • name: 名稱

      • description: 描述

      • preImg: 預(yù)覽圖

4. 數(shù)字人詳情查詢接口

4.1 接口調(diào)用

  • 請求方式: GET

  • 請求路徑: /open/digitalMan/detaiQuery/

  • 請求參數(shù): 數(shù)字人ID(必填)

4.2 接口結(jié)果

  • 返回數(shù)據(jù)結(jié)構(gòu)包括:

    • voices: 數(shù)字人聲音信息

    • clothes: 數(shù)字人服飾信息

5. 數(shù)字人合成相關(guān)接口

5.1 合成接口調(diào)用

  • 請求方式: POST

  • 請求路徑: /open/digitalMan/batch/generate

  • 請求參數(shù):

    {
     "generateParam": [
      {
         "algoParam": {
           "video": {},
           "background": "背景圖URL",
           "tts": {
             "text": "合成文本",
             "per": "聲音ID"
          },
           "position": [0, 0, 1080, 1801],
           "code": "數(shù)字人編碼",
           "is_green": true,
           "subtitle": true
        }
      }
    ],
     "callBackUrl": "回調(diào)地址"
    }

5.2 合成接口結(jié)果

  • 返回任務(wù)的 groupId

5.3 合成任務(wù)查詢接口

  • 請求方式: GET

  • 請求路徑: /open/digitalMan/batch/query/

  • 請求參數(shù): groupId

5.4 合成任務(wù)結(jié)果返回

  • 返回數(shù)據(jù)包括:

    • status: 當(dāng)前子任務(wù)合成狀態(tài)

    • composeUrl: 合成視頻的URL

    • textSegs: 播報內(nèi)容的相關(guān)信息

5.5 異步回調(diào)方式

  • 客戶端需根據(jù)簽名驗證回調(diào)請求的合法性。

6. 字幕文件生成

6.1 接口調(diào)用

  • 請求方式: POST

  • 請求路徑: /open/digitalMan/subtitle/generate

  • 請求參數(shù):

    • taskId: 任務(wù)ID

    • type: 字幕類型(可選,默認(rèn)srt

6.2 合成結(jié)果

  • 返回字幕文件的URL

7. 常見錯誤碼

  • SW-DM-1000: 合成任務(wù)創(chuàng)建失敗

  • SW-DM-1001: 租戶ID缺失

  • SW-DM-1002: 主參數(shù)缺失

  • SW-DM-1003: generateParam參數(shù)缺失

  • SW-DM-1004: algoParam參數(shù)缺失

  • SW-DM-1005: 數(shù)字人形象code參數(shù)缺失

  • SW-DM-1006: tts參數(shù)缺失

8. 結(jié)語

通過以上步驟,開發(fā)者可以快速上手新華智云離線數(shù)字人API,進行數(shù)字人的查詢和合成。請根據(jù)實際需求調(diào)整參數(shù)和請求方式,確保接口調(diào)用的成功。

指南詳情鏈接:https://aigc.shuwen.com/docs/zh-cn/human/real.html

 

<
依賴服務(wù)
>
<
產(chǎn)品問答
>
?
什么是AI離線數(shù)字人生成服務(wù)?
答案:AI離線數(shù)字人生成服務(wù)是一種利用人工智能技術(shù),通過計算機圖形學(xué)、深度學(xué)習(xí)等手段,為用戶提供快速、高效、定制化的數(shù)字人生成服務(wù)。用戶可以通過離線方式,簡單的輸入(如照片或視頻),快速生成高質(zhì)量的2D或3D數(shù)字人形象,適用于多種應(yīng)用場景。
?
AI離線數(shù)字人生成服務(wù)的核心功能有哪些?
核心功能包括通過AI技術(shù)快速從照片生成3D數(shù)字人、利用視頻采集生成2D數(shù)字人、實時渲染與智能交互、提供定制化服務(wù)以及離線API接口接入。
?
AI離線數(shù)字人生成服務(wù)的核心優(yōu)勢是什么?
核心優(yōu)勢包括高效快速的離線處理、高度逼真的數(shù)字人形象生成、強大的定制化離線服務(wù)、易于集成的離線API接口以及廣泛的應(yīng)用場景。
?
在哪些場景會用到AI離線數(shù)字人生成服務(wù)?
應(yīng)用場景包括媒體行業(yè)、金融行業(yè)、教育行業(yè)、娛樂行業(yè)等,用于新聞播報、天氣預(yù)報、綜藝節(jié)目、虛擬客服、虛擬教師、虛擬偶像或角色等數(shù)字人的應(yīng)用。
?
如何調(diào)用AI離線數(shù)字人生成服務(wù)的API接口?
通常通過Restful風(fēng)格的API接口進行離線調(diào)用,使用公網(wǎng)HTTP協(xié)議實現(xiàn)程序的自動化交互。具體的接口調(diào)用方式和參數(shù)說明,需要參考服務(wù)提供商的詳細(xì)文檔。
?
如何創(chuàng)建圖片數(shù)字人?
通過調(diào)用創(chuàng)建圖片數(shù)字人的離線API接口,可以基于圖片創(chuàng)建數(shù)字人形象,然后進行視頻合成或其他交互。
?
AI離線數(shù)字人生成服務(wù)支持哪些語音和視覺的多模態(tài)表達?
集成自然語言理解算法,根據(jù)播報的內(nèi)容智能驅(qū)動數(shù)字人表情和動作,實現(xiàn)語音、表情、手勢動作的多模態(tài)表達,所有操作均可在離線環(huán)境下完成。
?
使用AI離線數(shù)字人生成服務(wù)時,如何保護數(shù)據(jù)隱私?
在生成和使用AI數(shù)字人的過程中,尤其是在離線環(huán)境下,要嚴(yán)格保護用戶的隱私和數(shù)據(jù)安全,避免數(shù)據(jù)泄露或未經(jīng)授權(quán)的使用。
?
AI離線數(shù)字人生成服務(wù)在教育領(lǐng)域的應(yīng)用有哪些?
AI數(shù)字人可以作為智能教育助手,為學(xué)生提供個性化的學(xué)習(xí)輔導(dǎo),提高學(xué)習(xí)效果。此外,還可以作為虛擬教師,輔助教學(xué)活動或提供學(xué)習(xí)資源,所有這些應(yīng)用都可以在離線環(huán)境中實現(xiàn)。
<
關(guān)于我們
>
元卯AIGC是一家專注于AIGC(人工智能生成內(nèi)容)技術(shù)的公司,提供包括數(shù)字人和數(shù)字內(nèi)容在內(nèi)的元宇宙數(shù)字場景服務(wù)。公司通過定制形象的數(shù)字人技術(shù),實現(xiàn)輕松播報,同時提供視頻API等數(shù)字內(nèi)容服務(wù),致力于推動人工智能技術(shù)在內(nèi)容創(chuàng)作和傳播領(lǐng)域的應(yīng)用。
聯(lián)系信息
服務(wù)時間: 0:00 - 24:00
網(wǎng)頁在線客服: 咨詢

 虛擬數(shù)字人是指存在于非物理世界中,基于計算機圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成、人像建模等人工智能技術(shù),創(chuàng)造出來的一個可供真人或計算機驅(qū)動的形象實體,具有對物理世界的感知、認(rèn)知與表達能力,以電子屏、VR、AR等設(shè)備為載體,實現(xiàn)人機交互;通過其面向媒體、金融、會議、文旅、娛樂、教育、醫(yī)療等行業(yè),提供全新智能型服務(wù),降低人力成本,提升服務(wù)質(zhì)量和效率。在技術(shù)層面,虛擬數(shù)字人可被分為真人靈活驅(qū)動型和基于深度學(xué)習(xí)算法,智能驅(qū)動型兩類。 新華智云自主研發(fā)了真人驅(qū)動和智能驅(qū)動數(shù)字人技術(shù),結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和計算機圖形學(xué),深度鉆研聲音或視覺信息到面部及身體動作的建模和渲染,讓計算機能夠理解語音和圖像的內(nèi)容并以此精細(xì)驅(qū)動數(shù)字人形象的口唇、面部表情、頭部乃至全身的動作,生成極具逼真感的數(shù)字人視頻,進而實現(xiàn)AI驅(qū)動數(shù)字人的內(nèi)容生產(chǎn)鏈路。同時,新華智云數(shù)字人技術(shù)全方位覆蓋了包含2D仿真人數(shù)字人、2D卡通數(shù)字人、3D卡通數(shù)字人、3D寫實數(shù)字人等各個類型的數(shù)字人創(chuàng)造鏈路。 作為“懂內(nèi)容的技術(shù)公司”,新華智云將數(shù)字人技術(shù)與專業(yè)視頻編輯系統(tǒng)相結(jié)合,推出數(shù)字人大廳這款虛擬數(shù)字人的視頻編輯與生產(chǎn)平臺,為內(nèi)容生產(chǎn)者提供涉及數(shù)字人相關(guān)的內(nèi)容采集、編輯、存儲、分發(fā)等全生產(chǎn)鏈的專有技術(shù)。在國內(nèi)乃至全球的數(shù)字人技術(shù)領(lǐng)域新華智云數(shù)字人技術(shù)都處于領(lǐng)先地位。早在2019年6月我方產(chǎn)品已經(jīng)投入市場使用。目前已經(jīng)有超過280家國內(nèi)機構(gòu)、覆蓋了22個省、使用我方數(shù)字人產(chǎn)品,市場成熟度高、并已應(yīng)用在媒體、文旅、會展、金融等領(lǐng)域。

<
最可能同場景使用的其他API
>