訂閱
糾錯(cuò)
加入自媒體

再次炸天的OpenAI,大模型生態(tài)初現(xiàn)

 

文|郝    鑫

編|劉雨琦

不出意外地,OpenAI的首屆開發(fā)者大會(huì),讓人特別意外。

一夜醒來,大模型圈一只腳踏入了Agent的世界,另一只腳則踏入GPT Store生態(tài)的河流中。

美東時(shí)間11月6日,OpenAI開發(fā)者大會(huì)正式開啟,創(chuàng)始人兼CEO山姆·奧特曼站在臺(tái)上,45分鐘的密集輸出,再次展示了什么叫“遙遙領(lǐng)先”。

我們先簡單回顧一下這場(chǎng)發(fā)布會(huì)的所有重點(diǎn),其實(shí)無非就是三件事:

一是技術(shù)能力:GPT-4 Turbo升級(jí)了6大新能力,包括128K的上下文長度、更強(qiáng)的控制能力,模型的知識(shí)升級(jí)、多模態(tài)能力(語音和CV)、模型微調(diào)定制和更高速率的限制,性能升級(jí)的同時(shí),還對(duì)API調(diào)用的價(jià)格進(jìn)行了下調(diào);

二是可復(fù)制的能力:從原來的GPT到GPTs,用戶可以打造專屬于自己的GPT助手,企業(yè)可通過OpenAI提供的全套工具鏈“all tools”在企業(yè)內(nèi)部建設(shè)有價(jià)值的工具,同時(shí)也可以深入讓GPTs進(jìn)化為一個(gè)個(gè)Agents,為智能體做準(zhǔn)備;

三則是生態(tài)能力:企業(yè)不僅可以打造GPTs,更能將其上架在市場(chǎng)內(nèi),即GPT Store,可分享給其他用戶使用,以及獲得分成,類App Store的商業(yè)生態(tài)由此為出發(fā)點(diǎn)。

正如網(wǎng)易有道CEO周楓所言,“這次模型上主要是性能和成本的優(yōu)化,而在應(yīng)用和生態(tài)方面,做了很多LangChain(開發(fā)工具鏈),LlamaIndex(開發(fā)數(shù)據(jù)框架)這些項(xiàng)目類似的工作,最終就是要實(shí)現(xiàn)以智能體作為AI App的愿景。”

總之,OpenAI提供的生態(tài)能力解決了當(dāng)下大模型發(fā)展的幾個(gè)重要難點(diǎn),而在此之上,大模型的應(yīng)用層將迎來進(jìn)一步爆發(fā)。

“很興奮,還有很多信息在消化。”

OpenAI發(fā)布之后,光錐智能在與多位國內(nèi)知名大模型創(chuàng)業(yè)者交流中,也感受到了大家對(duì)行業(yè)前景的期待,“OpenAI的多模態(tài)能力開放,對(duì)開發(fā)者是很大的利好,可以做的事情的邊界得到進(jìn)一步拓展,我預(yù)計(jì)會(huì)有很多新的玩法出現(xiàn)。”月之暗面創(chuàng)始人楊植麟對(duì)光錐智能稱。

這45分鐘,為大模型火箭的二級(jí)爆發(fā),再次添加燃料。

讓大模型,飛入尋常百姓家

“有需求,打造生態(tài),找落地。”OpenAI首屆開發(fā)者大會(huì)結(jié)束后,某家國內(nèi)大模型明星公司 CEO 對(duì)光錐智能發(fā)表了極為簡短,卻信息量極大的點(diǎn)評(píng)。

市場(chǎng)對(duì)ChatGPT的需求,無疑是巨大的。在發(fā)布會(huì)的開始,奧特曼報(bào)告了 OpenAI 平臺(tái)和產(chǎn)品的一些數(shù)據(jù),截至目前,已經(jīng)有大約200萬開發(fā)人員在其API上構(gòu)建各種各樣的應(yīng)用,超過92%的全球500強(qiáng)企業(yè)正使用其產(chǎn)品,ChatGPT的周活躍用戶達(dá)到大約一億。

自GPT3.5問世到現(xiàn)在,每一次的升級(jí)都引領(lǐng)著大模型的下一個(gè)技術(shù)方向,不過,這次OpenAI GPT-4升級(jí)后的Turbo版本更像是查漏補(bǔ)缺。

首先是更長的上下文本長度,GPT-4Turbo上下文任務(wù)長度擴(kuò)展至128K,相當(dāng)于一本書的300多頁,是 GPT-4支持的8K上下文的16倍。不僅如此,奧特曼還強(qiáng)調(diào)在擴(kuò)展文本長度的同時(shí),還應(yīng)該保持模型的準(zhǔn)確性。

其次是彌補(bǔ)OpenAI一直以來的短板——安全可控和知識(shí)庫更新速度。針對(duì)前者,推出了名為Json Mode的新功能,確保開發(fā)人員更容易調(diào)用API,提升對(duì)模型輸入和輸出的控制;即將推出“Copyright Shield”(版權(quán)保護(hù))功能,若其企業(yè)和API用戶面臨版權(quán)侵權(quán)訴訟,OpenAI將為其承擔(dān)相應(yīng)費(fèi)用。針對(duì)后者,OpenAI平臺(tái)支持用戶導(dǎo)入文檔、數(shù)據(jù)庫來更新大模型的認(rèn)知,同時(shí)還將新升級(jí)后的GPT-4Turbo認(rèn)知理解更新到了2023年4月。

最后,此次更新中,OpenAI的多模態(tài)能力開放進(jìn)入到了一個(gè)全新的階段。上一個(gè)時(shí)期,OpenAI用了一年多的時(shí)間,實(shí)現(xiàn)了ChatGP能說、能看、能聽,而現(xiàn)在才到了多模態(tài)能力釋放的節(jié)點(diǎn)。DALL-E3、文生語音模型TTS(text-to-speech)、Whisper V3都將通過API的形式開放給開發(fā)者使用。

能力升級(jí)之后,為了讓更多的開發(fā)者用起來,還做了一個(gè)大降價(jià)。

奧特曼表示,不斷有開發(fā)者來向其抱怨,GPT-4定價(jià)太貴,也正是基于此,OpenAI這回干脆來了個(gè)大模型降價(jià)促銷。

降價(jià)后的GPT-4Turbo輸入token價(jià)格是GPT-4的三分之一,輸出token價(jià)格是原來的二分之一;GPT-3.5Turbo 4K 精調(diào)版本輸入token價(jià)格是此前的三分之一,輸出token價(jià)格是原來的二分之一;GPT-3.5Turbo 16K精調(diào)版本輸入token價(jià)格是之前的四分之一。

正如奧特曼所言開發(fā)者的需求是驅(qū)動(dòng)OpenAI降價(jià)的根本原因,這背后還有技術(shù)、商業(yè)等多重因素。

從技術(shù)降本看,根據(jù)外媒爆料,OpenAI此次可能將Stateless API變?yōu)镾tateful API,奧特曼此前曾表示,基于Stateful API,用戶不用再“重復(fù)一遍一遍地為同樣的歷史對(duì)話付費(fèi)”,理論上Stateful API形式可將大模型應(yīng)用的開銷削減為原來的二十分之一。

在商業(yè)上,OpenAI也一直在尋找突破點(diǎn),從API、ChatGPT個(gè)人版再到企業(yè)版,一直在探索商業(yè)化。但其對(duì)手卻未給喘息的機(jī)會(huì),微軟、Salesforce、開源生態(tài)主導(dǎo)者M(jìn)eta都在以更具性價(jià)比的方式,背后“偷襲”OpenAI,商業(yè)化的緊迫感與日俱增。

OpenAI降價(jià)的背后,也代表著國外大模型已經(jīng)進(jìn)入到了普惠化、追求高性價(jià)比的新時(shí)期。

對(duì)初創(chuàng)企業(yè)、開發(fā)者而言是落地的機(jī)會(huì),對(duì)OpenAI這類公司也是挑戰(zhàn),由降價(jià)而帶來的或許是技術(shù)能力、資源分配、算力等多方面的挑戰(zhàn)。

“在綜合考量后,我們優(yōu)先考慮了價(jià)格,但速度卻不能同時(shí)兼得,這將是接下來研究的重點(diǎn)”,奧特曼道。

據(jù)多名使用GPT-4開發(fā)工具的技術(shù)人員稱,GPT-4速率限制已經(jīng)開始加倍。

“算力應(yīng)該還好,OpenAI儲(chǔ)備足夠多”,楊植麟對(duì)此發(fā)表了意見。

為創(chuàng)業(yè)者提供“筑夢(mèng)”工具

光錐智能在與多位大模型創(chuàng)業(yè)者交流過程中發(fā)現(xiàn),很多創(chuàng)業(yè)者不是缺乏好點(diǎn)子和創(chuàng)業(yè)想法,而是受困于數(shù)據(jù)、算力、工具、部署、訓(xùn)練、推理等一個(gè)個(gè)的技術(shù)難題。

比如,知乎上一位基于大模型開發(fā)的對(duì)話解謎小游戲的開發(fā)者,就因?yàn)橛螒蛴脩魯?shù)量遠(yuǎn)超預(yù)期,導(dǎo)致算力不足而被迫關(guān)閉了整個(gè)游戲,留給玩家的只有一片遺憾和不舍。

同樣在國內(nèi),創(chuàng)業(yè)者們不是不知道Agent是未來的創(chuàng)業(yè)方向,而是心有余力不足。一位Agent創(chuàng)業(yè)者告訴光錐智能,“數(shù)據(jù)清洗、長文本記憶、代碼編寫、運(yùn)行測(cè)試、部署落地、成本等等九九八十一難,關(guān)關(guān)難過,關(guān)關(guān)卡死每一個(gè)創(chuàng)業(yè)公司”。

據(jù)光錐智能了解,無論國內(nèi)外,Agent離落地還差得很遠(yuǎn),目前比較確定的場(chǎng)景可能是Code Agent。原因在于,編碼本身就屬于大模型訓(xùn)練推理和Agent執(zhí)行任務(wù)的一環(huán),距離最近,改造也越容易。

而現(xiàn)在,OpenAI發(fā)布的all tools工具、assistant API(助手API)則有希望使上述這些問題迎刃而解。

assistant API 是OpenAI專門為AI Agent開發(fā)者量身打造的工具助手,涵蓋了長線程(Threading)、知識(shí)庫(Retrieval) 、代碼解釋器(Code interpreter)、函數(shù)調(diào)用(Function calling)幾項(xiàng)工具。

持久且無限長的線程,允許開發(fā)人員將線程狀態(tài)管理移交給OpenAI并解決上下文窗口約束;支持檢索功能,利用模型之外的知識(shí)來增強(qiáng),例如專有領(lǐng)域數(shù)據(jù)、產(chǎn)品信息或用戶提供的文檔;支持代碼解釋器功能,與ChatGPT Plus中一樣,可以在沙盒執(zhí)行環(huán)境中編寫和運(yùn)行Python代碼,生成圖形和圖表,并處理具有多種數(shù)據(jù)和格式的文件;函數(shù)調(diào)用功能也迎來更新,現(xiàn)在可以一次性調(diào)用多個(gè)函數(shù),并把響應(yīng)合并到消息輸出中。

總而言之,這些新功能精準(zhǔn)切中了開發(fā)者們卡脖子的痛點(diǎn),在OpenAI打造的全流程工具鏈上開發(fā)運(yùn)行,將降低研發(fā)的門檻,縮短研發(fā)、測(cè)試周期,同時(shí)節(jié)省人力成本。

“我們對(duì)OpenAI又愛又恨,一方面它升級(jí)的工具有可能一瞬間讓我們的業(yè)務(wù)跑通,但另一方面,我們也得時(shí)刻警惕被OpenAI取而代之”,一位Agent創(chuàng)業(yè)者道。

讓我們聚焦這次發(fā)布會(huì)的主角——“Agent”。奧特曼給Agent下的定義為,人們利用工具、AI來建立更個(gè)人化和定制化的分身,這些分身可以代表個(gè)人做很多事情。用戶只需詢問計(jì)算機(jī)所想要的東西,Agent分身就能替你完成所有任務(wù)。

光錐智能梳理OpenAI做Agent思路后發(fā)現(xiàn),Agent不是憑空而來,一切都基于GPT的大模型,在大模型基礎(chǔ)上先是長出了GPT的分身“GPTs”,而后才是“AI Agent”。

“在OpenAI,我們一直篤定漸進(jìn)的、迭代的部署是解決安全問題的最佳方式,即人工智能的安全挑戰(zhàn)。我們認(rèn)為謹(jǐn)慎對(duì)待面向未來Agent尤為重要,這需要大量的技術(shù)工作以及關(guān)于社會(huì)的深思熟慮,所以我們正在邁出通往未來的一小步——GPTs”,奧特曼表示道。

OpenAI通向未來Agent之路已初現(xiàn)雛形,正如其所言,“這還只是通向AI Agents邁出的第一步”,未來也許是多模態(tài)、多智能體。

初建大模型生態(tài)

技術(shù)的迭代固然讓人興奮,工具的推出也讓開發(fā)者們更加方便快捷,但更重要的是,OpenAI憑借一己之力,讓大模型的商業(yè)化進(jìn)一步落地。

早在今年5月,OpenAI開放插件系統(tǒng)后,首批上線了70個(gè)大模型相關(guān)的應(yīng)用,包括猜詞、翻譯、查找股票數(shù)據(jù)等等工具,彼時(shí)便有人預(yù)測(cè)到,大模型的App Store來了,但后期應(yīng)用逐漸增加,卻并沒有跑出“爆款級(jí)”應(yīng)用。

有投資人認(rèn)為:現(xiàn)在的GPT Store很像剛剛面世時(shí)的小程序,處于能力逐步補(bǔ)齊中,此次升級(jí)便是逐漸走向成熟的象征,下一個(gè)微信或者抖音,很有可能在此誕生。

此次發(fā)布會(huì)中,OpenAI重新梳理了應(yīng)用商店的體系,小幅調(diào)整了頁面布局,將ChatGPT變成了與第三方應(yīng)用并列的應(yīng)用層級(jí),并將開發(fā)范圍擴(kuò)大到了一個(gè)全新的范疇,按照奧特曼的說法,每一個(gè)GPT像是為ChatGPT的一個(gè)特殊目的,而量身定制的版本。

但讓人更為興奮的是,參考蘋果App Store,用戶可在GPT Store中搜索下載GPT應(yīng)用,商店也將推薦生產(chǎn)力、教育和好玩等類別的優(yōu)質(zhì)產(chǎn)品,OpenAI也明確了創(chuàng)建者可根據(jù)自有GPT的適用人數(shù)進(jìn)行分成。這意味著,基于大模型的應(yīng)用有了“容器”,開發(fā)者找到了買賣的“市場(chǎng)”。

舉個(gè)簡單的例子:大模型本身一塊塊地皮,工具箱是錘子釘子,不同的開發(fā)者將蓋不同房子,GPT Store則是一個(gè)房地產(chǎn)市場(chǎng),也就是說,蓋出來房子不僅能自用,還能租出去和賣出去。

有了商業(yè)化的“交易場(chǎng)”,創(chuàng)業(yè)者們就有了正反饋,這使得創(chuàng)業(yè)不再只靠激情和夢(mèng)想,而是擁有了現(xiàn)實(shí)收益的可能。

這或許也正是大模型創(chuàng)業(yè)者所言的“找落地”,上半年的AI創(chuàng)業(yè)離不開兩個(gè)字“燒錢”,5000萬的融資金額對(duì)大模型創(chuàng)業(yè)而言簡直是“滄海一瓢”,投資人不敢出手,創(chuàng)業(yè)者們也講不出新故事。

在現(xiàn)場(chǎng),OpenAI的工作人員展示了OpenAI搭建的一款旅游GPT的用法:它不僅能列出巴黎旅游建議,還能在地圖上將計(jì)劃中提到的地點(diǎn)按類別標(biāo)記起來,而這完全可以對(duì)用戶收費(fèi)或者進(jìn)行會(huì)員制。

雖然,這并不代表每一個(gè)登陸了GPT Store的應(yīng)用都能賺到錢,但至少有一個(gè)窗口可以獲得第一批種子用戶,從而反哺產(chǎn)品進(jìn)步,形成增長飛輪。

參考移動(dòng)互聯(lián)網(wǎng)應(yīng)用爆發(fā)的年代,每一個(gè)細(xì)分領(lǐng)域創(chuàng)業(yè)者都能挖掘出無數(shù)的需求形成應(yīng)用,這或許也正是創(chuàng)業(yè)者們?yōu)橹d奮的原因。

這時(shí),才按下了所有APP重新做一遍的啟動(dòng)鍵。

“我們相信,AI會(huì)以一種前所未見的規(guī)模,予以個(gè)體和機(jī)構(gòu)新的能力。這也將把整個(gè)人類提升到我們前所未見的規(guī)模”,奧特曼在結(jié)尾時(shí)提到。

顯然,OpenAI想做的,還有更多。基礎(chǔ)設(shè)施已經(jīng)初步搭建完畢,剩下的,就是等時(shí)間和生態(tài)的其他角色,來開花結(jié)果。

       原文標(biāo)題 : 再次炸天的OpenAI,大模型生態(tài)初現(xiàn)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)