百模大戰(zhàn),誰是下一個ChatGPT?
文|光錐智能,作者|周文斌,編輯|王一粟
“不敢下手,現(xiàn)在中國還沒跑出來一家絕對有優(yōu)勢的大模型,上層應(yīng)用沒法投,擔(dān)心押錯寶!蓖顿Y人Jucy(化名)向光錐智能表示,AI項目看得多、投的少是這段時間的VC常態(tài)。
ChatGPT點燃AI大爆炸2個月中,中國一直在等待自己的GPT-3.5。
AI真的冒犯到了打工人。游戲團隊替代掉30%的原畫師、電商團隊用AIGC生成低成本數(shù)字人模特、基礎(chǔ)程序員也感受到了被降維打擊的焦慮......眼看著GPT在國外要將所有領(lǐng)域都重新做一遍的趨勢,科技顛覆裹挾著金錢的味道滾滾而來。
于是,除了焦慮的打工人,企業(yè)急著用大模型降本增效,創(chuàng)業(yè)者急著接入大模型推出新產(chǎn)品,股市急著用ChatGPT概念割韭菜,培訓(xùn)機構(gòu)更是先賺一波為敬。
襯托之下,反而顯得喜歡追逐風(fēng)口的中國科技巨頭們比以往更沉得住氣。
果然,周期使人成長,公司也是。
終于,眾望所歸、望眼欲穿、姍姍來遲,4月第二周,中國也迎來了新一代大模型的密集發(fā)布。
·繼通義千問開放測試4天后,張勇在接手阿里云后首次亮相,宣布所有阿里產(chǎn)品未來將接入“通義千問”大模型,進行全面改造;
·商湯科技在10日的技術(shù)交流會上,演示了“日日新”大模型的能力:對話、AI繪畫、編程、數(shù)字人,第二天開盤大漲9%;
·華為盤古大模型在8日低調(diào)亮相,但并于10日發(fā)布新產(chǎn)品;
·明星創(chuàng)業(yè)者王小川公開亮相,攜手搜狗老搭檔茹立云正式開啟AI創(chuàng)業(yè)的新征程,將在下半年推出百川智能的大模型;
·毫末發(fā)布首個自動駕駛大模型DriveGPT雪湖·海若,把人類反饋強化學(xué)習(xí)引入到駕駛領(lǐng)域。
就連游戲公司昆侖萬維也趕來湊熱鬧,宣稱“中國第一個真正實現(xiàn)智能涌現(xiàn)”的國產(chǎn)大語言模型將于17日啟動邀請測試,但隨后被媒體質(zhì)疑其借熱點炒作股價。
熱熱鬧鬧、真真假假,大模型一時竟然有點亂花漸欲迷人眼。中國的大模型怎么就一下子如雨后春筍般都冒了出來?如果不重復(fù)造輪子,大家還能干點什么?
雖然是摸著Open AI過河,但中國大模型也都邁入了無人區(qū)。
01 涌現(xiàn)之前:亦步亦趨,又分道揚鑣
如果要為AI大模型找一個時間節(jié)點,2019年應(yīng)該是關(guān)鍵的一個。
這一年2月,遠在大洋彼岸的OpenAI推出了GPT-2,恰好也是這個時間點,微軟慷慨的投入了10億美元,讓OpenAI從“非營利性”組織變成了“盈利上限”組織。
大概在一個月之后,太平洋的另一邊,百度發(fā)布了ERNIE1.0,成為中國第一個正式開放的預(yù)訓(xùn)練大模型。
但這種第一其實有很多,比如華為的盤古大模型,業(yè)界首個千億參數(shù)的中文語言預(yù)訓(xùn)練模型;比如阿里的M6,中國首個千億參數(shù)多模態(tài)大模型;再比如騰訊HunYuan,國內(nèi)首個低成本、可落地的NLP萬億大模型.....
總之,只要定語加的足夠多,就總能在某個領(lǐng)域當(dāng)?shù)谝。那段時間,從硅谷到北京西二旗、再從五道口到上海臨港,包括華為、阿里、騰訊、商湯在內(nèi),凡是有能力的企業(yè),都開始涉足AI大模型的相關(guān)研究。
但中國第一波AI大模型的“涌現(xiàn)”卻是在兩年之后。
2021年,曾任職過微軟亞洲工程院院長、后被雷軍親自邀請到金山接替求伯君任CEO的張宏江,牽頭成立的智源研究院發(fā)布“悟道1.0”,包括國內(nèi)首個面向中文的NLP大模型、首個中文通用圖文多模態(tài)大模型和首個具有認知能力的超大規(guī)模預(yù)訓(xùn)練的模型等等。
智源成立于2018年,也就是OpenAI發(fā)布GPT-1.0的前五個月,作為北京市和科技部牽頭成立,并集合學(xué)界和頭部科技企業(yè)資源的研究機構(gòu),智源其實是中國早期探索AI大模型的一個代表。
可以說,“悟道1.0”其實為中國后來所有AI大模型的一個樣本。除此之外,智源研究院還為中國構(gòu)建了大規(guī)模預(yù)訓(xùn)練模型技術(shù)體系,并建設(shè)開放了全球最大中文語料數(shù)據(jù)庫WuDaoCorpora,為后來其他企業(yè)發(fā)展AI大模型打下了基礎(chǔ)。
也正是在“悟道1.0”之后,中國大模型開始出現(xiàn)井噴的狀態(tài)。
2021年,華為基于昇騰AI與鵬城實驗室聯(lián)合發(fā)布了鵬程盤古大模型。2022年,阿里發(fā)布了“通義”大模型系列,騰訊發(fā)布混元AI大模型......
在中國AI大模型如雨后春筍般涌現(xiàn)的同時,國外的AI大模型也走到了從量變到質(zhì)變的節(jié)點。
2022年11月,OpenAI發(fā)布了基于GPT-3.5的ChatGPT,徹底打開了人工智能的魔盒,然后就是席卷全球的AI 2.0浪潮。
事實上,如果以2018年GPT-1發(fā)布為節(jié)點,中國的AI大模型的發(fā)展與國外的發(fā)展脈絡(luò)一直都亦步亦趨,但ChatGPT為什么并沒有出現(xiàn)在中國?
這其實和國內(nèi)外AI大模型兩種不同的發(fā)展路徑有關(guān)。
從目前國外具有代表性的AI大模型產(chǎn)品來看,比如ChatGPT、Midjourney、Notion AI或者Stable diffusion等等,都是以C端用戶為基礎(chǔ)的產(chǎn)品。
而反觀國內(nèi),目前大模型的主要應(yīng)用場景的都在B端。
比如阿里的“通義”大模型的典型應(yīng)用場景包括電商跨模態(tài)搜索、AI輔助設(shè)計、開放域人機對話、法律文書學(xué)習(xí)、醫(yī)療文本理解等等,而騰訊的HunYuan-NLP-1T大模型則應(yīng)用在騰訊廣告、搜索、對話等內(nèi)部產(chǎn)品落地,或者像商湯的大模型,為自動駕駛、機器人等通用場景任務(wù)提供感知和理解能力支持。
之所以選擇To B,一個重要的原因是,B端能夠更容易進行商業(yè)化。
To B的行業(yè)特點導(dǎo)致中國的AI大模型并不需要做到非常大的參數(shù)規(guī)模,甚至于當(dāng)ChatGPT出來之后,國內(nèi)的公司討論的一個重要方向,是如何將已有的大模型規(guī)!白鲂 保瑧(yīng)用到具體的行業(yè)上。
所以中國采用谷歌BERT路線的AI大模型會比較多,以更小的參數(shù),做更有效率,更適合垂類的場景。
所以某種程度上,從出生的第一天,中國大模型就帶著商業(yè)化的任務(wù)。
而國外To C的大模型則不同,如ChatGPT的用戶在短短兩個月就達到一億,其底層預(yù)訓(xùn)練大模型GPT-3.5作為通用大模型,“大”成為參數(shù)的一個基本要求。
這在某種程度上促進OpenAI不停為GPT增加參數(shù),然后激發(fā)更強大的“涌現(xiàn)”現(xiàn)象,最終實現(xiàn)“大力出奇跡”的ChatGPT。
因此,To B和To C兩種完全不一樣的發(fā)展路徑,也將中國和美國的AI大模型引向了兩種完全不同的發(fā)展方向。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價拍賣
- 5 具身智能火了,但規(guī)模落地還需時間
- 6 國產(chǎn)英偉達們,抓緊沖刺A股
- 7 三次錯失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實力拉滿
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市