久久久久久噜噜噜久久久精品,日批视频在线免费观看

從ChatGPT到Sora，奧特曼要做創(chuàng)世者？

2024-02-18 09:00

出品 | 何璽排版 | 葉媛

ChatGPT之后，OpenAI再次讓人驚嘆！2月16日，奧特曼發(fā)布OpenAI首個(gè)視頻生成大模型Sora。

Sora能做什么？它又為什么讓業(yè)界如此震驚？

首先，Sora能夠圖文成片。文本成片方面，Sora能夠根據(jù)用戶提供的文本描述完整、準(zhǔn)確生成長(zhǎng)達(dá)60S的的高品質(zhì)視頻。圖片成片方面，Sora不僅能夠從文本生成視頻，還能夠從現(xiàn)有的靜態(tài)圖像開(kāi)始，準(zhǔn)確地動(dòng)畫(huà)化圖像內(nèi)容，或者擴(kuò)展現(xiàn)有視頻，填補(bǔ)視頻中的缺失幀。此外，Sora還能夠生成包含多個(gè)角色、特定運(yùn)動(dòng)類(lèi)型以及主題精確、背景細(xì)節(jié)復(fù)雜的場(chǎng)景。要知道，再此之前，Pika，RunwayMl，Stable Video等AI視頻大模型一次性生成的視頻時(shí)長(zhǎng)也就幾秒。

其次，Sora還有強(qiáng)大的語(yǔ)音理解能力和多鏡頭生成能力。語(yǔ)言理解方面，Sora能夠準(zhǔn)確解釋提示并生成能表達(dá)豐富情感的角色。這使得模型能夠更好地理解用戶的文本指令，并在生成的視頻內(nèi)容中忠實(shí)地反映這些指令。多鏡頭方面，Sora可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭，同時(shí)保持角色和視覺(jué)風(fēng)格的一致性。這種能力對(duì)于制作電影預(yù)告片、動(dòng)畫(huà)或其他需要多視角展示的內(nèi)容非常有用。

第三，Sora有強(qiáng)大的物理世界模擬能力。Sora能夠模擬現(xiàn)實(shí)世界的一些人、動(dòng)物和環(huán)境方面行為的能力。值得一提的是，這些屬性的出現(xiàn)并沒(méi)有依賴于任何明確的3D建模、物體識(shí)別等歸納偏差，而是純粹通過(guò)模型的尺度擴(kuò)展而自然涌現(xiàn)的。

第三點(diǎn)有一點(diǎn)不好理解，璽哥簡(jiǎn)單解釋一下，就是Sora已經(jīng)初步具有了洞察物理世界運(yùn)行規(guī)律的能力。比如人物人類(lèi)“咬”食物后，食物會(huì)留下咬痕，畫(huà)家在畫(huà)布上涂抹會(huì)留下新的筆觸等。

除了以上能力，Sora還具有視頻到視頻編輯，圖片生成等能力。

薩姆奧特曼要做創(chuàng)世者？

看到這里，或許有人會(huì)說(shuō)，Sora雖然強(qiáng)大，但也就是一個(gè)視頻生成模型而已，如果你也這樣認(rèn)為，那就大錯(cuò)特錯(cuò)了。下面璽哥聊聊個(gè)人對(duì)Sora的一點(diǎn)看法。

目前我們看到的Sora生成的視頻還只是OpenAI放出來(lái)的demo，但從放出來(lái)的這些視頻可知，在洞察物理世界運(yùn)行規(guī)律這件事情上，OpenAI已經(jīng)找到了一條模擬真實(shí)世界的路徑。而從OpenAI官方文檔透露的信息來(lái)看，Sora并不只是做一個(gè)簡(jiǎn)單的視頻生成工具，其根本目的是做一個(gè)物理世界模擬器，為真實(shí)世界建模�；蛟S在不遠(yuǎn)的未來(lái)，OpenAI將構(gòu)建一個(gè)和真實(shí)世界一模一樣的”AI擬真世界“。這個(gè)”AI擬真世界“不僅有和真實(shí)世界一模一樣的山川河流等自然環(huán)境，也有一模一樣的物理運(yùn)行規(guī)則。那時(shí)，人類(lèi)或可以在這個(gè)擬真世界以百倍，千倍，萬(wàn)倍的效率完成學(xué)習(xí)、成長(zhǎng)。

當(dāng)然，想要在這個(gè)”AI擬真世界“生活，你必須要有一個(gè)AI世界的身份，那就是人類(lèi)的“數(shù)字人”分身。談到數(shù)字人分身，我們不得不提ChatGPT，因?yàn)樗?ldquo;人”了。ChatGPT不僅能夠通過(guò)學(xué)習(xí)和理解人類(lèi)的語(yǔ)言來(lái)進(jìn)行對(duì)話，還能根據(jù)聊天的上下文進(jìn)行互動(dòng)。ChatGPT不僅能理解人的意圖，還有自己的思辨能力，能夠推理，能夠勝任許多人類(lèi)工作�，F(xiàn)在，隨著應(yīng)用商店的發(fā)布，ChatGPT更實(shí)現(xiàn)了對(duì)人類(lèi)能力的分類(lèi)。

現(xiàn)在，我們把Sora和ChatGPT結(jié)合起來(lái)看看，一個(gè)是要復(fù)制一個(gè)真實(shí)的物理環(huán)境，一個(gè)是要復(fù)制一個(gè)真實(shí)的人，真實(shí)的物理環(huán)境+人，不就等于一個(gè)新的世界嗎？

或許在不久的將來(lái)，我們的人生就將分成兩部分，一個(gè)是AI世界中的我們，一個(gè)是現(xiàn)實(shí)世界的我們。至于是AI世界中的我們更重要，還是現(xiàn)實(shí)世界中的我們更重要，就要看個(gè)人更適合在哪種環(huán)境中生活了。

到那個(gè)時(shí)候，或許奧特曼真的就成了“AI擬真世界”的創(chuàng)世者。

原文標(biāo)題 : 從ChatGPT到Sora，奧特曼要做創(chuàng)世者？