訂閱
糾錯
加入自媒體

百模大戰(zhàn),誰是下一個ChatGPT?

文|光錐智能,作者|周文斌,編輯|王一粟

“不敢下手,現(xiàn)在中國還沒跑出來一家絕對有優(yōu)勢的大模型,上層應(yīng)用沒法投,擔(dān)心押錯寶!蓖顿Y人Jucy(化名)向光錐智能表示,AI項目看得多、投的少是這段時間的VC常態(tài)。

ChatGPT點燃AI大爆炸2個月中,中國一直在等待自己的GPT-3.5。

AI真的冒犯到了打工人。游戲團隊替代掉30%的原畫師、電商團隊用AIGC生成低成本數(shù)字人模特、基礎(chǔ)程序員也感受到了被降維打擊的焦慮......眼看著GPT在國外要將所有領(lǐng)域都重新做一遍的趨勢,科技顛覆裹挾著金錢的味道滾滾而來。

于是,除了焦慮的打工人,企業(yè)急著用大模型降本增效,創(chuàng)業(yè)者急著接入大模型推出新產(chǎn)品,股市急著用ChatGPT概念割韭菜,培訓(xùn)機構(gòu)更是先賺一波為敬。

襯托之下,反而顯得喜歡追逐風(fēng)口的中國科技巨頭們比以往更沉得住氣。

果然,周期使人成長,公司也是。

終于,眾望所歸、望眼欲穿、姍姍來遲,4月第二周,中國也迎來了新一代大模型的密集發(fā)布。

·繼通義千問開放測試4天后,張勇在接手阿里云后首次亮相,宣布所有阿里產(chǎn)品未來將接入“通義千問”大模型,進行全面改造;

·商湯科技在10日的技術(shù)交流會上,演示了“日日新”大模型的能力:對話、AI繪畫、編程、數(shù)字人,第二天開盤大漲9%;

·華為盤古大模型在8日低調(diào)亮相,但并于10日發(fā)布新產(chǎn)品;

·明星創(chuàng)業(yè)者王小川公開亮相,攜手搜狗老搭檔茹立云正式開啟AI創(chuàng)業(yè)的新征程,將在下半年推出百川智能的大模型;

·毫末發(fā)布首個自動駕駛大模型DriveGPT雪湖·海若,把人類反饋強化學(xué)習(xí)引入到駕駛領(lǐng)域。

就連游戲公司昆侖萬維也趕來湊熱鬧,宣稱“中國第一個真正實現(xiàn)智能涌現(xiàn)”的國產(chǎn)大語言模型將于17日啟動邀請測試,但隨后被媒體質(zhì)疑其借熱點炒作股價。

熱熱鬧鬧、真真假假,大模型一時竟然有點亂花漸欲迷人眼。中國的大模型怎么就一下子如雨后春筍般都冒了出來?如果不重復(fù)造輪子,大家還能干點什么?

雖然是摸著Open AI過河,但中國大模型也都邁入了無人區(qū)。

01 涌現(xiàn)之前:亦步亦趨,又分道揚鑣

如果要為AI大模型找一個時間節(jié)點,2019年應(yīng)該是關(guān)鍵的一個。

這一年2月,遠在大洋彼岸的OpenAI推出了GPT-2,恰好也是這個時間點,微軟慷慨的投入了10億美元,讓OpenAI從“非營利性”組織變成了“盈利上限”組織。

大概在一個月之后,太平洋的另一邊,百度發(fā)布了ERNIE1.0,成為中國第一個正式開放的預(yù)訓(xùn)練大模型。

但這種第一其實有很多,比如華為的盤古大模型,業(yè)界首個千億參數(shù)的中文語言預(yù)訓(xùn)練模型;比如阿里的M6,中國首個千億參數(shù)多模態(tài)大模型;再比如騰訊HunYuan,國內(nèi)首個低成本、可落地的NLP萬億大模型.....

總之,只要定語加的足夠多,就總能在某個領(lǐng)域當(dāng)?shù)谝。那段時間,從硅谷到北京西二旗、再從五道口到上海臨港,包括華為、阿里、騰訊、商湯在內(nèi),凡是有能力的企業(yè),都開始涉足AI大模型的相關(guān)研究。

但中國第一波AI大模型的“涌現(xiàn)”卻是在兩年之后。

2021年,曾任職過微軟亞洲工程院院長、后被雷軍親自邀請到金山接替求伯君任CEO的張宏江,牽頭成立的智源研究院發(fā)布“悟道1.0”,包括國內(nèi)首個面向中文的NLP大模型、首個中文通用圖文多模態(tài)大模型和首個具有認知能力的超大規(guī)模預(yù)訓(xùn)練的模型等等。

智源成立于2018年,也就是OpenAI發(fā)布GPT-1.0的前五個月,作為北京市和科技部牽頭成立,并集合學(xué)界和頭部科技企業(yè)資源的研究機構(gòu),智源其實是中國早期探索AI大模型的一個代表。

可以說,“悟道1.0”其實為中國后來所有AI大模型的一個樣本。除此之外,智源研究院還為中國構(gòu)建了大規(guī)模預(yù)訓(xùn)練模型技術(shù)體系,并建設(shè)開放了全球最大中文語料數(shù)據(jù)庫WuDaoCorpora,為后來其他企業(yè)發(fā)展AI大模型打下了基礎(chǔ)。

也正是在“悟道1.0”之后,中國大模型開始出現(xiàn)井噴的狀態(tài)。

2021年,華為基于昇騰AI與鵬城實驗室聯(lián)合發(fā)布了鵬程盤古大模型。2022年,阿里發(fā)布了“通義”大模型系列,騰訊發(fā)布混元AI大模型......

在中國AI大模型如雨后春筍般涌現(xiàn)的同時,國外的AI大模型也走到了從量變到質(zhì)變的節(jié)點。

2022年11月,OpenAI發(fā)布了基于GPT-3.5的ChatGPT,徹底打開了人工智能的魔盒,然后就是席卷全球的AI 2.0浪潮。

事實上,如果以2018年GPT-1發(fā)布為節(jié)點,中國的AI大模型的發(fā)展與國外的發(fā)展脈絡(luò)一直都亦步亦趨,但ChatGPT為什么并沒有出現(xiàn)在中國?

這其實和國內(nèi)外AI大模型兩種不同的發(fā)展路徑有關(guān)。

從目前國外具有代表性的AI大模型產(chǎn)品來看,比如ChatGPT、Midjourney、Notion AI或者Stable diffusion等等,都是以C端用戶為基礎(chǔ)的產(chǎn)品。

而反觀國內(nèi),目前大模型的主要應(yīng)用場景的都在B端。

比如阿里的“通義”大模型的典型應(yīng)用場景包括電商跨模態(tài)搜索、AI輔助設(shè)計、開放域人機對話、法律文書學(xué)習(xí)、醫(yī)療文本理解等等,而騰訊的HunYuan-NLP-1T大模型則應(yīng)用在騰訊廣告、搜索、對話等內(nèi)部產(chǎn)品落地,或者像商湯的大模型,為自動駕駛、機器人等通用場景任務(wù)提供感知和理解能力支持。

之所以選擇To B,一個重要的原因是,B端能夠更容易進行商業(yè)化。

To B的行業(yè)特點導(dǎo)致中國的AI大模型并不需要做到非常大的參數(shù)規(guī)模,甚至于當(dāng)ChatGPT出來之后,國內(nèi)的公司討論的一個重要方向,是如何將已有的大模型規(guī)!白鲂 保瑧(yīng)用到具體的行業(yè)上。

所以中國采用谷歌BERT路線的AI大模型會比較多,以更小的參數(shù),做更有效率,更適合垂類的場景。

所以某種程度上,從出生的第一天,中國大模型就帶著商業(yè)化的任務(wù)。

而國外To C的大模型則不同,如ChatGPT的用戶在短短兩個月就達到一億,其底層預(yù)訓(xùn)練大模型GPT-3.5作為通用大模型,“大”成為參數(shù)的一個基本要求。

這在某種程度上促進OpenAI不停為GPT增加參數(shù),然后激發(fā)更強大的“涌現(xiàn)”現(xiàn)象,最終實現(xiàn)“大力出奇跡”的ChatGPT。

因此,To B和To C兩種完全不一樣的發(fā)展路徑,也將中國和美國的AI大模型引向了兩種完全不同的發(fā)展方向。

1  2  3  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號