訂閱
糾錯(cuò)
加入自媒體

Sora刷屏!哪些A股上市公司或?qū)⑹芤妫?/p>

《投資者網(wǎng)》葉芯

近日,OpenAI的文生視頻模型Sora刷屏了。

2月16日,OpenAI在其官網(wǎng)發(fā)布文生視頻模型Sora。據(jù)介紹,該模型可以生成長(zhǎng)達(dá)一分鐘的視頻,同時(shí)保持視覺(jué)品質(zhì)并遵循用戶提示。

作為OpenAI首推的文本轉(zhuǎn)視頻模型,Sora的問(wèn)世,宣告了新一輪科技革命的到來(lái)。Sora驚艷炸裂的效果,沖擊著當(dāng)前的AI行業(yè)。Sora橫空出世后,又將帶來(lái)怎樣的變革?資本市場(chǎng)哪些上市公司將受益?

Sora面世

Sora作為OpenAI首推的文本轉(zhuǎn)視頻模型,能夠嚴(yán)格根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像,生成長(zhǎng)達(dá)1分鐘的視頻,保持較高的視覺(jué)質(zhì)量,其中包含精細(xì)復(fù)雜的場(chǎng)景、生動(dòng)的角色表情以及復(fù)雜的鏡頭運(yùn)動(dòng)。同時(shí)也接受現(xiàn)有視頻擴(kuò)展或填補(bǔ)缺失的幀。

OpenAI表示,Sora能夠生成復(fù)雜的場(chǎng)景,不僅包括多個(gè)角色,還有特定的動(dòng)作類型,以及對(duì)對(duì)象和背景的準(zhǔn)確細(xì)節(jié)描繪。除此之外,Sora還可以將靜態(tài)圖像制作成動(dòng)畫。文本指令和靜態(tài)圖像均能生成準(zhǔn)確反映用戶提示的視頻。

國(guó)泰君安研報(bào)指出,Sora具有三大突出亮點(diǎn),一是60秒長(zhǎng)視頻,Sora可以保持視頻主體與背景的高度流暢性與穩(wěn)定性。二是單視頻多角度鏡頭,Sora在一個(gè)視頻內(nèi)實(shí)現(xiàn)多角度鏡頭,分鏡切換符合邏輯且十分流暢。三是理解真實(shí)世界的能力,Sora對(duì)于光影反射、運(yùn)動(dòng)方式、鏡頭移動(dòng)等細(xì)節(jié)處理得十分優(yōu)秀,極大地提升了真實(shí)感。

與目前AI視頻賽道同行相比,Sora每條提示60秒的視頻長(zhǎng)度,遠(yuǎn)高于Pika Labs的3秒、Meta Emu Video的4秒和Runway公司Gen-2的18秒的視頻時(shí)長(zhǎng)。

此外,從官方發(fā)布的演示來(lái)看,無(wú)論從視頻流暢度還是細(xì)節(jié)表現(xiàn)能力上,Sora的效果都相當(dāng)驚艷。

不過(guò),目前Sora仍在開(kāi)發(fā)中,OpenAI承認(rèn)該模型可能會(huì)混淆提示的空間細(xì)節(jié),例如混淆左右,并且難以精確描述隨著時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。同時(shí),OpenAI還稱,可擴(kuò)展的視頻生成模型,是構(gòu)建物理世界通用模擬器的一條可能的路徑。

Sora的面世,意味著AI視頻生成能力實(shí)現(xiàn)了跨越式發(fā)展。該模型可以深度模擬真實(shí)物理世界,標(biāo)志著人工智能在理解真實(shí)世界場(chǎng)景并與之互動(dòng)的能力方面實(shí)現(xiàn)了重大飛躍。

應(yīng)用前景廣闊

近年來(lái),OpenAI領(lǐng)跑AI賽道。2021年初和2022年末,OpenAI分別推出了圖像生成系統(tǒng)DALL·E和聊天機(jī)器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具,也正逐漸改變?nèi)藗儗?duì)未來(lái)工作的看法。

如今,Sora模型能夠生成一分鐘的高保真視頻。視頻格式既可以是橫屏1920*1080視頻,豎屏1080*1920視頻,以及之間的所有內(nèi)容。這使得Sora可以兼容不同的視頻播放設(shè)備,根據(jù)特定的縱橫比來(lái)生成視頻內(nèi)容,這也會(huì)大大影響視頻創(chuàng)作領(lǐng)域,包括電影制作、電視內(nèi)容、自媒體等。

國(guó)盛證券認(rèn)為,文生視頻大模型Sora橫空出世,其能夠理解并呈現(xiàn)物理定律,影視動(dòng)畫行業(yè)的顛覆性時(shí)刻到來(lái)。

據(jù)介紹,Sora是基于過(guò)去對(duì)DALL·E和GPT的研究基礎(chǔ)構(gòu)建,利用DALL·E 3的重述提示詞技術(shù),為視覺(jué)模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注,因此模型能更好的遵循文本指令。

對(duì)此,360集團(tuán)創(chuàng)始人周鴻祎表示,Sora的技術(shù)思路完全不一樣。之前我們做視頻做圖用的都是Diffusion,是多個(gè)真實(shí)圖片的組合,這次OpenAI利用它的大語(yǔ)言模型優(yōu)勢(shì),把LLM和Diffusion結(jié)合起來(lái)訓(xùn)練,讓Sora實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實(shí)的,才能跳出2D的范圍模擬真實(shí)的物理世界。

“這都是大模型的功勞。OpenAI訓(xùn)練這個(gè)模型應(yīng)該會(huì)閱讀大量視頻。一幅圖勝過(guò)千言萬(wàn)語(yǔ),而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過(guò)一幅圖,這就離AGI(通用人工智能)不遠(yuǎn)了,不是10年20年的問(wèn)題,可能一兩年很快就可以實(shí)現(xiàn)。”周鴻祎稱。

周鴻祎表示,這也代表未來(lái)的方向。有強(qiáng)勁的大模型做底子,基于對(duì)人類語(yǔ)言的理解,對(duì)人類知識(shí)和世界模型的了解,再疊加很多其他的技術(shù),就可以創(chuàng)造各個(gè)領(lǐng)域的超級(jí)工具,比如生物醫(yī)學(xué)、蛋白質(zhì)和基因研究,包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上,大模型都會(huì)發(fā)揮作用。這次Sora對(duì)物理世界的模擬,至少將會(huì)對(duì)機(jī)器人具身智能和自動(dòng)駕駛帶來(lái)巨大的影響。

國(guó)盛證券也持有相同的觀點(diǎn)。其認(rèn)為文生視頻大模型Sora橫空出世,其能夠理解并呈現(xiàn)物理定律,影視動(dòng)畫行業(yè)的顛覆性時(shí)刻到來(lái)。

對(duì)于Sora的面世,工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員、數(shù)字經(jīng)濟(jì)專家劉興亮稱,這標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個(gè)新紀(jì)元。

“Sora能夠生成持續(xù)一分鐘左右的1080P高清視頻,涵蓋多個(gè)角色、不同類型的動(dòng)作和背景細(xì)節(jié)等,幾乎達(dá)到了電影級(jí)別的逼真場(chǎng)景。這種能力不僅為內(nèi)容創(chuàng)作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度將創(chuàng)意變?yōu)楝F(xiàn)實(shí),而且為觀眾帶來(lái)了更豐富和多樣化的視覺(jué)體驗(yàn)。技術(shù)創(chuàng)新的這一巨大飛躍,預(yù)示著AI在未來(lái)人類生活的各個(gè)方面都將發(fā)揮更加重要的作用。”劉興亮表示。

AI基礎(chǔ)設(shè)施需求旺盛

市場(chǎng)觀點(diǎn)認(rèn)為,2022年是影像之年,2023是聲波之年,而2024是視頻之年。

OpenAI表示,Sora是構(gòu)建世界模型的基礎(chǔ),未來(lái)將向?qū)崿F(xiàn)AGI繼續(xù)邁進(jìn)。

對(duì)于Sora的發(fā)展,算力需求旺盛。國(guó)泰君安指出,Sora模型推動(dòng)AI多模態(tài)領(lǐng)域飛躍式發(fā)展,AI創(chuàng)作等相關(guān)領(lǐng)域?qū)⒂瓉?lái)深度變革,AI賦能范圍進(jìn)一步擴(kuò)大,多模態(tài)相關(guān)的訓(xùn)練及推理應(yīng)用也將進(jìn)一步提升對(duì)算力基礎(chǔ)設(shè)施的相關(guān)需求。

無(wú)獨(dú)有偶,國(guó)盛證券也持有相同的觀點(diǎn),其認(rèn)為,Sora依舊符合AI縮尺律(Scaling Law)OpenAI在技術(shù)文檔中說(shuō)明,隨著訓(xùn)練計(jì)算量的增加,樣本質(zhì)量明顯提高,進(jìn)一步佐證了多模態(tài)時(shí)代,算力需求將成為最核心的瓶頸之一。

多模態(tài)大模型拉動(dòng)全球算力需求快速增長(zhǎng),國(guó)產(chǎn)AI算力迎來(lái)機(jī)會(huì)。根據(jù)南方財(cái)富網(wǎng)趨勢(shì)選股系統(tǒng)數(shù)據(jù)統(tǒng)計(jì),A股國(guó)產(chǎn)AI算力相關(guān)上市企業(yè)目前數(shù)量有52家,如國(guó)產(chǎn)AI算力產(chǎn)業(yè)鏈包含AI服務(wù)器零部件、服務(wù)器整機(jī)、算力租賃、數(shù)據(jù)中心等環(huán)節(jié)。AI服務(wù)器零部件公司主要包括海光信息、寒武紀(jì)、龍芯中科、景嘉微等;服務(wù)器整機(jī)公司主要包括高新發(fā)展、神州數(shù)碼、拓維信息、廣電運(yùn)通、烽火通信、同方股份等;算力租賃公司主要包括恒潤(rùn)股份、云賽智聯(lián)、鴻博股份等;數(shù)據(jù)中心公司主要包括奧飛數(shù)據(jù)、光環(huán)新網(wǎng)、寶信軟件、數(shù)據(jù)港等。

此外,多家巨頭謀劃布局AI基礎(chǔ)設(shè)施。舉例來(lái)看,主營(yíng)視頻創(chuàng)意、繪圖創(chuàng)意類軟件產(chǎn)品的萬(wàn)興科技近日在互動(dòng)平臺(tái)表示,公司旗下視頻創(chuàng)意產(chǎn)品萬(wàn)興喵影/Filmora可用于各類視頻的創(chuàng)作和剪輯,“天幕”大模型是以視頻創(chuàng)意類AI技術(shù)為核心的多媒體大模型,涵蓋音頻、圖像、視頻等多模態(tài)能力。

昆侖萬(wàn)維旗下Star Group和Opera都具備做短視頻的土壤,其中Opera在海外已經(jīng)推出了短視頻功能。此外,昆侖萬(wàn)維天工大模型在騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合廈門大學(xué)開(kāi)展的多模態(tài)大語(yǔ)言模型測(cè)評(píng)中,綜合得分排名第一。

專業(yè)智能視頻解決方案與視頻云服務(wù)提供商當(dāng)虹科技擁有自研的AIGC工具集,于去年上半年發(fā)布以靜態(tài)照片生成三維體積視頻的方案。

當(dāng)虹科技1月5日互動(dòng)平臺(tái)表示,公司擁有自研的AIGC工具集,發(fā)布了以靜態(tài)照片生成三維體積視頻的方案,并且通過(guò)點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺(jué)無(wú)損壓縮,實(shí)現(xiàn)不同模態(tài)之間相互切換。

因賽集團(tuán)旗下InsightGPT目前可生成20秒以上的視頻,能夠結(jié)合圖像、視頻大模型,融合摳圖等多種算法,再結(jié)合音頻模型,整體渲染后最終合成完整視頻。

據(jù)不完全統(tǒng)計(jì),包括萬(wàn)興科技、博匯科技、易點(diǎn)天下、數(shù)碼視訊、漢王科技、當(dāng)虹科技、東方國(guó)信、神思電子、因賽集團(tuán)、拓爾思、國(guó)脈文化、佳都科技在內(nèi)的超10家A股上市公司近三個(gè)月以來(lái)在互動(dòng)平臺(tái)披露視頻生成模型領(lǐng)域的業(yè)務(wù)情況。(思維財(cái)經(jīng)出品)■

來(lái)源:投資者網(wǎng)

       原文標(biāo)題 : Sora刷屏!哪些A股上市公司或?qū)⑹芤妫?/span>

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)