訂閱
糾錯(cuò)
加入自媒體

數(shù)字人被百度玩明白了

2022-07-08 16:26
霞光社
關(guān)注

數(shù)字人被百度玩明白了

作者 | 郭照川

編輯 | 麻吉

一直以來(lái),數(shù)字人被認(rèn)為是元宇宙的入口。

7月6日,在2022百度世界大會(huì)的預(yù)溝通會(huì)上,一位紅發(fā)少女率先登場(chǎng),以兼具“科技感”和“專業(yè)度”的虛擬形象,在此次會(huì)議全程擔(dān)任了關(guān)鍵的串詞、控場(chǎng)、提問和嘉賓介紹工作。

實(shí)用型虛擬數(shù)字人正在走進(jìn)大眾視野,百度旗下數(shù)字人度曉曉就是其中之一。雖然她的“主業(yè)”是百度App的虛擬AI助手,但度曉曉同時(shí)又被賦予了實(shí)用性的“多重身份”:

她既是參加過國(guó)內(nèi)頂尖藝術(shù)院校畢業(yè)展的“AI畫家”,又是成功挑戰(zhàn)過高考命題作文的“AI作家”,還是創(chuàng)作過歌曲、接過廣告、發(fā)行過MV的“AI偶像”。

作畫、譜曲、做主持、寫作文、陪聊天......百度硬核技術(shù)支持下的數(shù)字人特有的創(chuàng)造性和交互性,讓人不得不相信現(xiàn)實(shí)世界與“元宇宙”的邊界正在被打破,數(shù)字人則將成為與日常生活密切聯(lián)結(jié)的有力輔助。

擁有個(gè)性化交互能力的數(shù)字人,真的存在嗎?元宇宙發(fā)展到現(xiàn)在,最先進(jìn)的數(shù)字人又被賦予了哪些意想不到的能力?

數(shù)字人被百度玩明白了

圖源:2022百度世界大會(huì)預(yù)溝通會(huì)

數(shù)字人被百度玩明白了

從二次元到“N次元”

談到虛擬人物,難離“二次元”。

從初代虛擬偶像初音未來(lái),到許多傳統(tǒng)行業(yè)的數(shù)字代言人形象,基本上都是由二次元人物設(shè)計(jì)脫胎而來(lái)。

對(duì)于“二次元”來(lái)說(shuō),創(chuàng)造是最難的。雖然這些數(shù)字人外觀設(shè)計(jì)得十分完美,但應(yīng)用路徑也非常單一,哪怕是超寫實(shí)數(shù)字人形象,都脫離不了無(wú)法實(shí)現(xiàn)交互、本身無(wú)法創(chuàng)造的局限。

而在今年的西安美術(shù)學(xué)院的本科畢業(yè)展上,有一系列命名為“無(wú)界”的畫作,打破了傳統(tǒng)數(shù)字人的創(chuàng)造“結(jié)界”。

這一系列作品的創(chuàng)作者,是百度數(shù)字人度曉曉。雖然畫面由AI數(shù)字人所繪,但也被美院教授認(rèn)證為 “已經(jīng)達(dá)到了本科美術(shù)生的基本要求”。其商業(yè)價(jià)值同樣不可小覷,這些繪畫數(shù)字藏品其中的四幅,在獲展出之前就已經(jīng)賣出了超過17萬(wàn)元的高價(jià)。

今年6月7日高考結(jié)束后,度曉曉又以全國(guó)新高考Ⅰ卷作文《本手、妙手、俗手》為題,在40秒的時(shí)間內(nèi)完成了審題、邏輯、創(chuàng)作等步驟,創(chuàng)作出了40多篇不同的高考作文,還被高考研究專家申怡老師,評(píng)判為可以打出48分的“高分作文”。

不久前,“#國(guó)內(nèi)首個(gè)可交互虛擬偶像度曉曉”還登上了熱搜。她作為百度數(shù)字人作詞、編曲了歌曲《每分 每秒 每天》,還和龔俊數(shù)字人一起舉辦了新歌發(fā)布會(huì)直播。知名樂評(píng)人耳帝也認(rèn)為,度曉曉背后的人工智能創(chuàng)造內(nèi)容確實(shí)可以“提高創(chuàng)作效率、降低門檻、輔助創(chuàng)作”。

在AI內(nèi)容創(chuàng)作能涉及的領(lǐng)域內(nèi),度曉曉幾乎無(wú)處不在,于是她也被大家笑稱為元宇宙時(shí)代“最卷數(shù)字人”。除了能寫會(huì)畫的“數(shù)字才女”度曉曉,百度旗下另一位數(shù)字人希加加,也吸引了不少關(guān)注目光。

希加加一度被稱為“第一個(gè)吃到漢堡的數(shù)字人”。在成都和大連的繁華街頭,希加加成為數(shù)字人新品推薦官,從麥當(dāng)勞門店上方的巨大屏幕中閃身而出,抓住了一只大漢堡,一瞬間虛擬與現(xiàn)實(shí)的連接讓人過目難忘。

數(shù)字人被百度玩明白了

圖源:麥當(dāng)勞

她不僅成為了“00號(hào)太空數(shù)字乘客”,登上了我國(guó)第一艘數(shù)字載人飛船,還接下了和Qee熊、FE賽車一起合作設(shè)計(jì)的許多任務(wù),儼然像一個(gè)賽博朋克的新員工了。

目前數(shù)字人真正落地后,展示出來(lái)的實(shí)際使用價(jià)值,已經(jīng)超出了我們想象中的認(rèn)知邊界——從被動(dòng)的二次元單薄形象,演變?yōu)槟軅鋵?shí)理解能力,能實(shí)現(xiàn)創(chuàng)意作品的自動(dòng)生成的數(shù)字人物,給世界帶來(lái)越來(lái)越多的驚喜。

從被設(shè)定問答程序的單一“二次元”,到富有創(chuàng)意、適用場(chǎng)景更多元的“N次元”,度曉曉和希加加等百度“AI數(shù)字人家族”的出場(chǎng),讓數(shù)字人賽道的前景變得更加驚艷。

數(shù)字人被百度玩明白了

告別“虛火”,鋪開實(shí)際應(yīng)用價(jià)值

隨著“元宇宙”和“Web 3.0”概念崛起,數(shù)字人成為當(dāng)下最熱的風(fēng)口之一。

根據(jù)艾媒咨詢數(shù)據(jù),2021年中國(guó)數(shù)字人產(chǎn)業(yè)市場(chǎng)規(guī)模和核心市場(chǎng)規(guī)模分別達(dá)到1074.9億元和62.2億元,預(yù)計(jì)2025年將達(dá)到6402.7億元和480.6億元。光是2021年全年,虛擬數(shù)字人相關(guān)投資就有16筆。

2022年第一個(gè)月,虛擬人領(lǐng)域百起融資金額累計(jì)已經(jīng)超過了4億元人民幣。曾經(jīng)推出知名虛擬IP“翎”的魔琺科技,也在今年4月剛剛完成了B輪和C輪共計(jì)1.3億美元的融資。

伴隨著市場(chǎng)對(duì)數(shù)字人的極高期望,也出現(xiàn)了很多質(zhì)疑聲音。

許多人認(rèn)為目前元宇宙以及數(shù)字人尚處在非常早期的階段,反而是風(fēng)刮得太猛,導(dǎo)致只剩下“概念橫行”“一把虛火”。此類看法并非空穴來(lái)風(fēng),當(dāng)下依然存在著許多行業(yè)隱憂,例如數(shù)字人AI驅(qū)動(dòng)技術(shù)不達(dá)標(biāo)、實(shí)際應(yīng)用場(chǎng)景不足、制作成本太高等等。

然而,隨著數(shù)字人的應(yīng)用場(chǎng)景和技術(shù)提升,此次百度數(shù)字人也展示出了其特殊性:

度曉曉和希加加與市面的上其他數(shù)字人的不同,她們最大的突破點(diǎn)就在于已經(jīng)實(shí)現(xiàn)了“可交互”——無(wú)論是度曉曉還是希加加,都可以在多樣化的實(shí)際應(yīng)用場(chǎng)景中高度擬真,實(shí)現(xiàn)像真人一樣互動(dòng)。

度曉曉已經(jīng)具備了對(duì)話能力。閑來(lái)無(wú)事,用戶可以像真人一樣隨時(shí)和她聊天,或者讓她唱歌來(lái)聽,獨(dú)特的情感交互系統(tǒng)讓她像一個(gè)隨時(shí)在身邊的虛擬助手,又像一個(gè)真實(shí)存在的可靠伙伴。

數(shù)字人被百度玩明白了

圖源:百度APP

甚至面對(duì)不同的人的交互方式,個(gè)人性格和愛好,度曉曉也會(huì)呈現(xiàn)出不一樣的理解和反饋。也就是說(shuō),在你身邊的數(shù)字助理度曉曉,無(wú)時(shí)無(wú)刻都和你共同處于向更優(yōu)秀的自己的進(jìn)化之中。

除了對(duì)話,度曉曉還能真正做到“理解”用戶,區(qū)分閑聊與搜索意圖,滿足用戶提出的更多生活需求。例如當(dāng)你告訴度曉曉“想要看電影”時(shí),她會(huì)像朋友一樣給你推薦影片。而如果你的需求是“想要喝咖啡”,她甚至能自動(dòng)跳轉(zhuǎn)到咖啡小程序,方便你下單一杯咖啡外賣。

虛擬朋友穿插進(jìn)整個(gè)生命過程的陪伴,滿足能交互、有回應(yīng)、滿足多種功能需求,才是理想中數(shù)字人的“最終形態(tài)”。

數(shù)字人被百度玩明白了

數(shù)字人之戰(zhàn):大廠實(shí)力圖鑒

各家互聯(lián)網(wǎng)大廠,紛紛在數(shù)字人領(lǐng)域瘋狂加碼。

不久前,字節(jié)跳動(dòng)收購(gòu)了虛擬社交公司“波粒子科技”,也是看上了其擁有的虛擬人物形象自定義核心技術(shù),意在為元宇宙再添一張牌。近年來(lái)專注于智能語(yǔ)音和AI技術(shù)的科大訊飛,也在去年年底上線虛擬人交互系統(tǒng)1.0,試圖拓寬人工智能生態(tài)。

事實(shí)上,百度在很早之前喊出了“All in AI”的口號(hào),2020年就已經(jīng)籌備上線的度曉曉,誕生于元宇宙浪潮發(fā)端之初,一開始就具備了AI驅(qū)動(dòng)下的視覺識(shí)別和語(yǔ)音識(shí)別能力,背后百度又有AIGC(AI generated content,人工智能創(chuàng)造內(nèi)容)內(nèi)容技術(shù)的支持。

百度旗下的虛擬人家族,在互聯(lián)網(wǎng)大廠的元宇宙賽道競(jìng)爭(zhēng)中的優(yōu)勢(shì)也很明顯。

根據(jù)第三方機(jī)構(gòu)發(fā)布的榜單,百度憑借多年以來(lái)語(yǔ)音、視覺等AI能力的積累,在數(shù)字人綜合實(shí)力方面排名第一,尤其在數(shù)字人大規(guī)模落地領(lǐng)域,有著強(qiáng)大領(lǐng)先實(shí)力。

一方面,百度數(shù)字人背后擁有知識(shí)增強(qiáng)大模型“文心大模型”。

度曉曉、希加加都是具備AIGC能力的數(shù)字人,度曉曉創(chuàng)作的AI畫制成的數(shù)字藏品,在百度上線24小時(shí)內(nèi)就賣出了8700多份。而這種平均每幅畫用時(shí)只需要數(shù)十秒的數(shù)字人創(chuàng)作,完全顛覆了當(dāng)下已知的內(nèi)容生產(chǎn)模式。

這樣令人驚異的AIGC高效輸出能力,則是依托于百度文心大模型。數(shù)字人的繪畫創(chuàng)作技能,靠的就是文心大模型-跨模態(tài)圖文生成模型ERNIE-ViLG。

另一方面,百度AI算法得到突破,使得數(shù)字人的制作成本極大收縮,降低了批量生產(chǎn)數(shù)字人的門檻。

百度集團(tuán)副總裁袁佛玉,在2022百度世界大會(huì)的預(yù)溝通會(huì)上也表示,“隨著百度AI算法的突破,能讓數(shù)字人制作成本十倍、百倍地下降,還能讓數(shù)字人生產(chǎn)周期,從動(dòng)輒幾個(gè)月,縮短到小時(shí)級(jí)別!

這一切,都讓數(shù)字人大規(guī)模應(yīng)用落地,甚至讓實(shí)現(xiàn)“人均一個(gè)數(shù)字人小助手”的元宇宙未來(lái)理想成為可能。這也正是今年百度世界大會(huì)的主題“AI深耕,萬(wàn)物生長(zhǎng)”所闡釋的,在出行、產(chǎn)業(yè)、生活等領(lǐng)域,人工智能都將發(fā)揮前所未有的作用。

7月21日,度曉曉、希加加等百度AI數(shù)字人家族成員,都將深度參與到百度2022世界大會(huì)之中。

今年的百度世界大會(huì),更像是一場(chǎng)對(duì)于尖端人工智能技術(shù)的一次創(chuàng)新式全民科普。擁有強(qiáng)大創(chuàng)造實(shí)力,具備陪伴和交互能力,且能實(shí)現(xiàn)可控成本批量復(fù)制的數(shù)字人,已經(jīng)為我們打開了元宇宙的大門。

       原文標(biāo)題 : 數(shù)字人被百度玩明白了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)