訂閱
糾錯
加入自媒體

Web 3.0后下一個風(fēng)口,AIGC將成未來內(nèi)容趨勢?

2022-11-23 10:25
VR陀螺
關(guān)注

文/VR陀螺 林德

AI,人工智能,從今年年初到現(xiàn)在已然成為互聯(lián)網(wǎng)最熱門、引起網(wǎng)友討論度最高的科技概念之一。

今年4月,一款名為DALL-E 2的AI繪畫模型誕生,在短短幾個月時間內(nèi)便風(fēng)靡全球,成為今年最火熱的AI繪畫模型,被譽(yù)為最強(qiáng)AI畫手。

無論是文藝復(fù)興風(fēng)格、寶麗來風(fēng)格,或是愛德華·霍普畫風(fēng)、莫奈畫風(fēng)、數(shù)字藝術(shù),亦或是復(fù)古風(fēng)、二戰(zhàn)歷史攝影風(fēng)格等等,DALL-E 2都能輕松實現(xiàn),只要給出關(guān)鍵詞,大約60秒便可以產(chǎn)生10張圖像供用戶選擇。

DALL-E 2部分作品(圖源:DALL-E 2)

腦洞無限大、寫實、易操作、更準(zhǔn)確的指令理解...各種元素的集合誕生了不少令人眼前一亮的創(chuàng)意作品,DALL-E 2的作品在社交媒體得到許多用戶的喜愛。

在DALL-E 2全網(wǎng)爆紅之前,輸入文字生成圖像,這種存在于想象中的事情成為現(xiàn)實的潮流就已經(jīng)開始流行。在今年年初,AI繪畫工具Disco Diffusion、Midjourney早已受到不少藝術(shù)家、時尚先鋒的青睞,不僅用于娛樂自嗨,商業(yè)用途中也能看見AI的身影。


在獲得羅拉多州博覽會藝術(shù)創(chuàng)作比賽活動一等獎之前,今年六月《經(jīng)濟(jì)學(xué)人》的期刊封面便是出自Midjourney之手。(圖源:《經(jīng)濟(jì)學(xué)人》)

AI繪畫平臺Midjourney在Discord上的訂閱人數(shù)也已超過百萬。


截止至9月7日,Midjourney在Discord的訂閱情況(圖源:VR陀螺)

從Disco Diffusion到MidJourney,再到DALL-E 2的全網(wǎng)流行,Text-to-Image(文字生成圖像)從小眾開發(fā)社群火到社交媒體進(jìn)入大眾眼簾,AI生成圖像的創(chuàng)作方式讓海內(nèi)外的用戶驚呼AI的發(fā)展竟然到了這種程度!

輸入“骨頭山”、“宗教化”、“火焰”、“無動于衷的人們”四組關(guān)鍵詞組獲得的四張AIGC圖像(圖源:VR陀螺)

最近,AI畫畫熱度退散之后,AI寫論文又再度幫助AI破圈。事情源于一篇Reddit上的帖子,發(fā)帖人Urdadgirl69表示他的論文就是由AI代筆完成,而他的老師并沒有發(fā)現(xiàn)作業(yè)的異常情況。


圖源:游戲研究社

更具有沖擊力的是,Meta在十月初發(fā)布的文本轉(zhuǎn)視頻Make-A-Video功能,意味著AI圖像制作領(lǐng)域又有了新的突破,在圖像逼真內(nèi)容豐富的情況下,邁向了動態(tài)的視頻領(lǐng)域。


輸入“一只穿著超人紅色披風(fēng)在天上飛的狗”獲得的視頻(圖源:Meta)

從“人均AI畫師”到“我讓AI幫我寫論文,不僅拿A,還能賺錢”,AI這個關(guān)鍵詞頻頻出圈。無論是AI生成圖像,還是AI生成文本,或是AI生成視頻,這些都被統(tǒng)稱為AIGC內(nèi)容生成模式。

AIGC,人工智能生成內(nèi)容,顧名思義是由人工智能驅(qū)動的工具創(chuàng)造的內(nèi)容,這種內(nèi)容生產(chǎn)模式在不僅在繪畫、寫作領(lǐng)域成為熱門趨勢,在游戲場景建模、數(shù)字人、AI聊天、科研AI for Science、AI換臉、音樂等領(lǐng)域也有所建樹,可以看到,這種模式正在成為新的主流。

AIGC當(dāng)?shù),資本的“新頭好”

獲益于頻頻在大眾視野中“刷臉”,AIGC的熱度以及前景讓越來越多的資本將目光放至于此。

今年9月,紅杉資本官方發(fā)表的一篇文章《Generative AI: A Creative New World》》中認(rèn)為AIGC將會代表新一輪范式轉(zhuǎn)移(認(rèn)知轉(zhuǎn)移)的開始。

圖源:網(wǎng)絡(luò)

近日,依靠文字生成Instagram標(biāo)題、Tiktok視頻腳本、廣告營銷文本、電子郵件等內(nèi)容,成立不到兩年時間的AIGC 初創(chuàng)公司 Jasper 宣布自身以15億美元的估值獲得 1.25億美元 A輪融資,搖身一變成為AIGC圈的新興強(qiáng)者。

圖源:Jasper

10月17日,英國開源人工智能公司 Stability AI 宣布獲得 1.01 億美元融資,估值高達(dá) 10 億美元,躋身獨(dú)角獸企業(yè)行列。

10月21日,根據(jù)澎湃新聞,《華爾街日報》表示谷歌公司正在展開談判,擬向人工智能初創(chuàng)企業(yè)Cohere投資至少2億美元。Cohere的業(yè)務(wù)包括開發(fā)自然語言處理軟件,包括聊天機(jī)器人等可以理解人類語音和文本的程序。

此外,微軟正對OpenAI的新一輪投資進(jìn)行后期談判。OpenAI推出了DALL·E 2項目,允許用戶通過文本生成圖像,即AI作畫。

不僅在海外AIGC企業(yè)有多起融資事件,甚至出現(xiàn)獨(dú)角獸企業(yè),在國內(nèi)AIGC類企業(yè)同樣備受資本青睞。

今年1月,超參數(shù)科技宣布完成1億美元B輪融資。

10月,虛擬內(nèi)容 AIGC 技術(shù)服務(wù)商慧夜科技完成千萬元人民幣Pre-A+ 輪融資,由高瓴資本和順為資本領(lǐng)投。

同樣發(fā)生在10月,成立于2021年的生成式AI平臺TIAMAT宣布完成數(shù)百萬美元天使輪融資。據(jù)了解,TIAMAT近4個月內(nèi)的全網(wǎng)曝光量已經(jīng)達(dá)到了5000萬,并且這個數(shù)據(jù)還在不斷攀升。

......

AIGC在投資圈已然成為資本重點(diǎn)關(guān)注對象,在科技界,科技大廠們也同樣將其視作重點(diǎn)戰(zhàn)略布局環(huán)節(jié)。

大廠重要戰(zhàn)略布局  AIGC是未來內(nèi)容趨勢

隨著互聯(lián)網(wǎng)的不斷升級,從Web 1.0到現(xiàn)在的Web 2.0,再到未來Web 3.0時代,以門戶網(wǎng)站為主的媒體時代到自媒體時代、社交平臺的興起,用戶對互聯(lián)網(wǎng)的依賴度逐漸上升,內(nèi)容生產(chǎn)方式也在進(jìn)行著變遷。

在Web 3.0時代中,數(shù)字世界將變得更為清晰,AI也一直被視為元宇宙關(guān)鍵技術(shù)之一、助力數(shù)字孿生的重要利器。從“只讀模式”的PGC(專業(yè)生產(chǎn)內(nèi)容)到用戶自發(fā)參與的UGC(用戶生產(chǎn)內(nèi)容)再到AIGC(AI生產(chǎn)內(nèi)容),內(nèi)容創(chuàng)作門檻正在逐步降低,內(nèi)容生產(chǎn)力無疑將獲得更高的釋放。

不妨想象一下,在虛擬世界里,無論是打造比擬真實場景的外在,還是塑造數(shù)字生物的“思想”內(nèi)在,都需要更高效、更實時的內(nèi)容創(chuàng)作,這也就凸顯了能夠突破人力限制的AI技術(shù)的重要性。

以游戲中的智能NPC為例,若每個NPC以智能體的形式存在,那么它不僅能夠識別所處環(huán)境狀態(tài)的變化,而且能夠根據(jù)環(huán)境狀態(tài)的調(diào)整行為策略,做出符合自身個性特征的行為。在任何場景下,玩家與智能體的每一次互動,智能體都能夠根據(jù)玩家狀態(tài)、環(huán)境狀態(tài)和自身狀態(tài)的參數(shù)做出相應(yīng)的行為,進(jìn)而在與玩家的互動過程中產(chǎn)生突發(fā)的動態(tài)內(nèi)容,這將對于數(shù)字世界的意義不言而喻。

電影《失控玩家》中自我意識覺醒的智能NPC男主(圖源:網(wǎng)絡(luò))

邁向下一代互聯(lián)網(wǎng)是各大科技巨頭、互聯(lián)網(wǎng)大廠,如今在元宇宙的加持下,數(shù)字化時代開啟新一輪加速,AIGC的背后生產(chǎn)力--人工智能技術(shù)早已被納入巨頭們的重要戰(zhàn)略布局之中。

去年12月,Meta已將其AI團(tuán)隊并入Reality Labs部門,以開發(fā)元宇宙。

今年1月24日,Meta在一篇博客文章中表示其公司研究團(tuán)隊正在打造一款新的人工智能超級計算機(jī),并有望在今年下半年沖擊“全球最快AI超算”寶座。

實際上,早在2017年,臉書就發(fā)布了第一代AI超級計算機(jī)。據(jù)Meta而言,相較于第一代超算,新的人工智能超級集群(RSC)在運(yùn)行計算機(jī)視覺工作流程的速度上提高了20倍,運(yùn)行英偉達(dá)集體通信庫(nccl)的速度提高了9倍多,自然語言處理能力則提高了三倍多,并且可以從數(shù)萬億例子中學(xué)習(xí),在數(shù)百種語言中運(yùn)作,分析文本、圖像和視頻的內(nèi)容是否有問題。

Meta AI團(tuán)隊的研究人員Kevin Lee和Shubho Sengupta在博文中表示,RSC將在下一個計算平臺元宇宙中發(fā)揮重要作用。

圖源:網(wǎng)絡(luò)

今年2月,在Meta AI: Inside the Lab活動上,Meta展示了其AIGC向的“探索性工具”原型Builder Bot。在Meta官方發(fā)布的視頻中,隨著扎克伯格“聲聲令下”,公園、海、沙灘、島嶼、云朵等,甚至BGM逐漸形成一個完整的場景。

圖源:Meta

這一切都是由AI驅(qū)動生成的內(nèi)容,通過語音搭建VR場景,Meta稱該工具將“促進(jìn)元宇宙的創(chuàng)造力”。

可以預(yù)見的是,這項技術(shù)如果取得成功,有很大可能會對其他VR世界和平臺產(chǎn)生影響,打造VR場景將會變得更加容易。如果將Meta的Builder bot技術(shù)整合,元宇宙的內(nèi)容生態(tài)也將獲得新的增長,例如,與已經(jīng)開始測試語音功能的游戲元宇宙平臺Roblox合作打造場景,以豐富生態(tài)內(nèi)容等等。

去年4月,英偉達(dá)打造的“工業(yè)元宇宙”創(chuàng)作平臺Omniverse以難辨真假的虛擬黃仁勛出圈,11月份,英偉達(dá)推出AI虛擬化身創(chuàng)建平臺Omniverse Avatar說,今年CES 2022上,英偉達(dá)宣布Omniverse三項AI新功能,助力AIGC。

從Omniverse到Omniverse Avatar,英偉達(dá)皆在幫助用戶更快速地合成所需的數(shù)字內(nèi)容,包括數(shù)字化場景、Avatar化身、甚至僅需一條音軌即可輕松制作3D人臉動動畫等等。

英偉達(dá)中國區(qū)Omniverse業(yè)務(wù)發(fā)展經(jīng)理何展曾表示,“從UGC過渡到AIGC,無論是設(shè)計師、創(chuàng)業(yè)公司和很多大的平臺公司都有明顯的趨勢。因為UGC已經(jīng)發(fā)展了很長時間,現(xiàn)在我們更想要快速工業(yè)化生產(chǎn)的平臺,讓大家能夠從AI紅利獲得更好的益處!

Q版AI黃仁勛(圖源:英偉達(dá))

不止海外大廠對AI,尤其是對AIGC這種新的內(nèi)容模式“給予厚望”,今年7月,國內(nèi)互聯(lián)網(wǎng)大廠百度在百度世界大會活動現(xiàn)場利用AI技術(shù)復(fù)原了《富春山居圖》殘卷,背后的核心技術(shù)便是AIGC。

在大會現(xiàn)場,百度掌門人李彥宏還表示:“AIGC是PGC、UGC之后,全新的內(nèi)容生產(chǎn)方式。它不僅會提升內(nèi)容生產(chǎn)的效率,也會創(chuàng)造出有獨(dú)特價值和獨(dú)立視角的內(nèi)容!

紅框部分為AIGC內(nèi)容(圖源:網(wǎng)絡(luò))

“未來十年,AIGC將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式?梢詫崿F(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,去生成AI原創(chuàng)內(nèi)容!

從二維向三維過渡  理想中的AIGC究竟有多難?

根據(jù)中國信通院發(fā)表的《人工智能生成內(nèi)容(AIGC)白皮書》,AIGC的發(fā)展階段分為三個,首先是受限于技術(shù)發(fā)展的早期概念階段,到1990年之后的沉淀積累階段,再到2010年至今的快速發(fā)展階段,特別是從2014年起,生成式對抗網(wǎng)絡(luò)(GAN)的提出與迭代更新,以及AI算法的升級讓AIGC迎來了百花齊放的內(nèi)容時代。

但目前AIGC的涉及范圍更多在圖像、視頻、語音等相對二維化的場景應(yīng)用中,而回到元宇宙這個愿景,三維化應(yīng)用場景才是關(guān)鍵,AIGC技術(shù)的應(yīng)用無疑將推動二維互聯(lián)網(wǎng)向三維互聯(lián)網(wǎng)的過渡,但理想的AIGC的難度可想而知。

二維與三維的區(qū)別(圖源:網(wǎng)絡(luò))

理想很豐滿,現(xiàn)實很骨感,這句話形容元宇宙,在某些程度上可以說是非常貼近。而要實現(xiàn)元宇宙內(nèi)容生產(chǎn)上的AIGC化究竟有多難?需要什么?

AIGC技術(shù)的提升背靠GAN和AI算法的支持,根據(jù)中國信通院的研究發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的升級是推動AIGC快速發(fā)展的另一個主要原因,實驗證明,深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和模型大小呈正相關(guān),伴隨著模型參數(shù)量的增加,相對應(yīng)深度神經(jīng)網(wǎng)絡(luò)的能力一般會取得大幅提升。

即使是模型架構(gòu)各有不同,但可以肯定的是,這些深度學(xué)習(xí)網(wǎng)絡(luò)的生成邏輯往往都需要大量的數(shù)據(jù)支撐。光是自然語言模型的突破,國內(nèi)外的企業(yè)和高校都投入了巨大的人力、算力,據(jù)悉,模型的參數(shù)量從千萬級已經(jīng)發(fā)展到了千億級別。

但三維世界的數(shù)據(jù)支撐相對而言就十分有限,要想在元宇宙中實現(xiàn)AIGC生產(chǎn)方式,首先需要龐大的三維素材庫。而三維素材的掃描,數(shù)據(jù)的收集顯然比二維更加麻煩,在如今激光雷達(dá)LiDAR這類深度攝像還未普及的情況下,三維素材的素材量顯然是不足以支撐一個理想的AIGC模型訓(xùn)練。

其次是,算力的升級。

相對于二維平面,三維空間相對增加了許多維度,除了語音語義識別、計算及圖像識別之外,還有空間識別例如距離、大小、空間位置等,因此在算力和模型架構(gòu)的升級是必不可少的。

以英偉達(dá)自動駕駛的演示案例為例,為了保證安全性,自動駕駛的車輛上采集器的數(shù)據(jù)來源需要非常多,激光雷達(dá)、雷達(dá)、攝像頭等。

這些采樣得到的數(shù)據(jù)不是單一的,而是多樣性的,包括地圖、環(huán)境位置、車內(nèi)狀況、突發(fā)情況等,因此自動駕駛車規(guī)級的計算機(jī)每秒鐘運(yùn)算的數(shù)據(jù)量是非常巨大的。而要達(dá)到高精度的三維場景自主搭建,計算力的升級也是極其重要的一環(huán)。

圖源:CNMO

理想化的元宇宙場景是根據(jù)個人喜好生成符合用戶自身的三維場景、人物形象等,目前,3D建模AIGC化已經(jīng)能在許多案例中看到,無論是Deepfake換臉技術(shù),還是自動生成3D模型的軟件等。但都還局限于XR技術(shù)的發(fā)展,目前3D化的場景與模型都只能在2D平面中看到。


3D建模手辦(圖源:機(jī)器之心)

并且,用戶的個性化數(shù)據(jù)需要龐大的用戶基數(shù),但用戶數(shù)據(jù)泄露、非法收集等安全問題也一直被詬病,在虛擬空間中引發(fā)的安全爭議也有不少案例。

此外,理想化AIGC最后一個關(guān)鍵是AI需要具備“意識”形成。

這里的意識不是指自我意識,而是能基于不用的語義信息、環(huán)境、概念等進(jìn)行創(chuàng)作的創(chuàng)作意識,例如一些智能NPC、虛擬人偶像等的應(yīng)用。

根據(jù)中國信通院的說法,按照技術(shù)的發(fā)展進(jìn)程和實際應(yīng)用的形態(tài),數(shù)字內(nèi)容的創(chuàng)作能力可劃分為基于模仿的創(chuàng)作和基于概念的創(chuàng)作兩類。

在未來,深度神經(jīng)網(wǎng)絡(luò)的高速發(fā)展下,人工智能將會被不斷刷新,伴隨著的將是人工智能更強(qiáng)的理解能力以及生成能力,數(shù)字內(nèi)容也將到達(dá)新的高度。

結(jié)語

科技巨頭們的舉動無疑是標(biāo)志著人工智能已經(jīng)被置于發(fā)展核心布局的一環(huán),在未來,人工智能將扮演關(guān)鍵角色。在AI的加持下,互聯(lián)網(wǎng)世界的內(nèi)容,無論是多樣性還是數(shù)量都將再次達(dá)到新的高峰,毫無疑問,AIGC將在互聯(lián)網(wǎng)內(nèi)容創(chuàng)作迭代上起到多么關(guān)鍵的推進(jìn)作用。

但作為最飽受爭議的科技之一,人工智能在不斷的發(fā)展、融合之中又在不斷地帶來新的創(chuàng)意,新的爭議,同時AI侵入學(xué)術(shù)界、教育界、藝術(shù)界等的事件讓大眾也產(chǎn)生了一定程度的危機(jī)感。

水能載舟,亦能覆舟。如同MidJourney的創(chuàng)始人大衛(wèi)·霍爾茨(David Holz)說的一般,“人們把人工智能看作一只老虎,一只危險的、會吃掉人的老虎。不過就像水一樣,水中也有危險,但人們可以游泳、造船、利用水發(fā)電,它既是危險的,又是文明的驅(qū)動力。這是一個機(jī)會,它沒有意志,我們可能會淹死在水中,但不意味著水應(yīng)該被禁止。人工智能就是一個新的水源,只要利用得當(dāng)就會讓人類變更好!

雖然AIGC對于信息生產(chǎn)的擴(kuò)展性的意義重大,但同時這需要計算機(jī)、數(shù)學(xué)、心理學(xué)、社會學(xué)、哲學(xué)等許多學(xué)科的交集,共同進(jìn)步人類才能跨越工業(yè)生產(chǎn)的下一步,這也是眾多科技巨頭仍在探索和努力的方向。


       原文標(biāo)題 : Web 3.0后下一個風(fēng)口,AIGC將成未來內(nèi)容趨勢?

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號