AI大模型內(nèi)卷加劇,商湯憑什么卷進來
作者|小葳
出品|智能進化論
2023年,國內(nèi)大模型何其多。
目前,已宣布推出或即將推出大模型的國內(nèi)企業(yè)多達20余家,基本上能想到的相關(guān)企業(yè)都已入局。其中,既有資金雄厚的BAT、華為、字節(jié)等大廠,也有王慧文、王小川、周伯文等互聯(lián)網(wǎng)大佬領(lǐng)銜的初創(chuàng)企業(yè),還有垂直領(lǐng)域的AI企業(yè),比如商湯科技、科大訊飛等。
4月10日,商湯推出“日日新SenseNova”大模型體系,包括一系列生成式AI模型:大語言模型“商量”、文生圖AI平臺“秒畫”、AI數(shù)字人視頻生成平臺“如影”、3D內(nèi)容生產(chǎn)平臺“瓊宇”、“格物”,以及大模型數(shù)據(jù)標(biāo)注平臺“明眸”。
在大模型的輿論場上,商湯并不高調(diào),而是直接搬出全套大模型產(chǎn)品,并迅速開放面向企業(yè)的試用通道。從發(fā)布會現(xiàn)場實時演示的效果看,商湯大模型的實力不容小覷。“一個專注CV的公司能在LLM上做出如此高成熟度產(chǎn)品,其開發(fā)團隊令人起敬。”一名知乎網(wǎng)友的觀點代表了一部分外界聲音。
同時,一些質(zhì)疑的聲音也出現(xiàn)了,比如有觀點認(rèn)為專注機器視覺賽道(CV)的獨角獸AI企業(yè)到底有沒有必要湊熱鬧搞大模型。畢竟大模型需要長期巨量燒錢,目前商業(yè)化模式有限,這會讓尚未盈利的AI企業(yè)面臨更大的虧損壓力。
那么,如何看待商湯進軍多模態(tài)大模型領(lǐng)域的布局?在日益擁擠的“中國版ChatGPT”競爭中,商湯又將走出怎樣與眾不同的生態(tài)位呢?
1 從大裝置到大模型,始終指向同一目標(biāo)
當(dāng)ChatGPT推動AI行業(yè)走過“iPhone時刻”,大模型的通用性已經(jīng)得到了成功驗證。
更重要的是,今年3月微軟發(fā)布的一篇論文指出,“GPT-4已經(jīng)可以被視為通用人工智能的一個早期的版本。”這一觀點也得到了相當(dāng)多專業(yè)人士的認(rèn)可。深度學(xué)習(xí)之父Geoffrey Hinton為代表的一些頂級科學(xué)家認(rèn)為,通用人工智能(AGI)不再遙不可及,而有可能在數(shù)十年內(nèi)逐步實現(xiàn)。
接下來,在大模型這一確定性的方向上,中外AI企業(yè)如何摸索出適合自己的道路,成為關(guān)鍵命題。
商湯對這個問題的答案是:堅定地走“大裝置+大模型”的道路。
了解商湯戰(zhàn)略的朋友會知道,商湯此時推出大模型并不是跟風(fēng),而是自身在持續(xù)解決AI規(guī);涞氐缆飞系挠忠粋關(guān)鍵節(jié)點。
此前,AI落地難的核心原因是一個場景一個模型的開發(fā)模式,導(dǎo)致落地成本高,模型復(fù)用率低,難以規(guī)模化標(biāo)準(zhǔn)化。彼時,2020年問世的千億參數(shù)的GPT3已經(jīng)為大模型的通用性帶來一定突破。商湯的解法同理,向下層基礎(chǔ)設(shè)施扎根,希望用龐大的參數(shù)量×數(shù)據(jù)量跑出通用性。
2021年,商湯推出AI大裝置SenseCore,并在2022年完成重要擴建。AI大裝置可以理解為大算力基礎(chǔ)設(shè)施+大模型即服務(wù)(Model as a Service)。
目前AI大裝置構(gòu)建了27000塊GPU構(gòu)成的并行計算系統(tǒng),實現(xiàn)了5.0exaFLOPS的算力輸出,是亞洲目前最大的智能計算平臺之一。商湯AI大裝置上的算力可以同步支持20個千億規(guī)模參數(shù)量的超大模型,并且以千卡規(guī)模來同時訓(xùn)練。
同時,AI大裝置還對外提供大模型即服務(wù),包括自動化數(shù)據(jù)標(biāo)注、大模型并行訓(xùn)練、推理部署等等。目前AI大裝置最大的集群由4000塊芯片并聯(lián)組成,可以訓(xùn)練參數(shù)量超5000億的稠密模型,今年的目標(biāo)是能夠訓(xùn)練超過萬億參數(shù)的大模型。
投入這么大,AI大裝置的應(yīng)用情況如何呢?
2022年,商湯將AI大裝置的能力向行業(yè)客戶開放,通過提供高性能計算資源、豐富的預(yù)訓(xùn)練模型庫、易用的開發(fā)工具和專業(yè)技術(shù)支持,幫助客戶高效訓(xùn)練大模型。目前已經(jīng)有超過10個大模型研發(fā)任務(wù)得以實現(xiàn),涵蓋了視覺、語言、多模態(tài)等領(lǐng)域的用戶自定義大模型開發(fā)。
面向企業(yè)開放后,AI大裝置已經(jīng)有了規(guī)模化的營收。根據(jù)商湯2022年年報,2022年AI大裝置對外服務(wù)產(chǎn)生的收入占比智慧商業(yè)(商湯四大業(yè)務(wù)板塊之一)整體收入超20%。按照2022年智慧商業(yè)收入14.64億元計算,AI大裝置已經(jīng)為商湯帶來近3億元營收。
看到這里你也許有些明白了,商湯并不是從零開始構(gòu)建大模型的。之所以能在短期內(nèi)迅速推出多種類型的大模型,離不開AI大裝置這個根基。而且實際上,商湯在大模型領(lǐng)域的布局要早于AI大裝置。
在最擅長的CV領(lǐng)域,2019年商湯就發(fā)布了10億參數(shù)的視覺大模型。2022年,商湯的視覺大模型已經(jīng)進化到了320億參數(shù),也是世界上迄今為止最大的視覺模型。
自2021年起,商湯科技開始自研NLP大模型和多模態(tài)模型。在NLP領(lǐng)域,商湯的大語言模型達到了千億參數(shù)級別。
在多模態(tài)領(lǐng)域, 2022年3月,商湯科技聯(lián)合上海人工智能實驗室、清華大學(xué)、香港中文大學(xué)、上海交通大學(xué)發(fā)布了多模態(tài)多任務(wù)通用大模型“書生(INTERN)”,擁有30億參數(shù)。書生大模型已經(jīng)在通用視覺開源平臺OpenGVLab開源,是目前開源模型社區(qū)性能最強的多模態(tài)大模型。
在AIGC領(lǐng)域,商湯推出10億參數(shù)的AIGC模型,能夠支持文生圖和圖生圖的各種功能。曾在星際爭霸的比賽中超越DeepMind的AlphaStar的商湯決策智能模型,未來也將融入到多模態(tài)大模型中。
“未來商湯的通用人工智能大模型體系會覆蓋視覺感知、語言理解、內(nèi)容生成和推理決策四大方面。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。
目前,商湯的大模型已在在智慧城市、智慧商業(yè)、智能汽車和智慧生活四大板塊20多個場景實現(xiàn)了落地交付。比如,在自動駕駛領(lǐng)域,商湯在視覺大模型領(lǐng)域研發(fā)的BEVFormer++感知算法以絕對優(yōu)勢贏得了2022年Waymo挑戰(zhàn)賽主賽道冠軍。
綜上,商湯做大模型的目標(biāo)不是去搶奪面向個人用戶的“中國版ChatGPT”的噱頭,而是用“大裝置+大模型”加速AI商業(yè)化落地。
2 “日日新”的雙重驅(qū)動力
“AGI催生了新的研究范式,即基于一個強大的多模態(tài)基模型,通過強化學(xué)習(xí)和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務(wù)。AGI將實現(xiàn)從‘數(shù)據(jù)飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。
具體到商湯“日日新”大模型,「智能進化論」認(rèn)為,其對于商湯而言至少有兩大方面的驅(qū)動力:
第一重驅(qū)動,通過豐富的AIGC大模型向外賦能,包括通過開放API的形式,降低各行各業(yè)應(yīng)用大模型的門檻;
目前商湯“日日新”系列大模型僅面向企業(yè)用戶開放試用。不過,從發(fā)布會實時演示來看,“日日新”大模型給人的初步印象是:整體能力全面,相當(dāng)于沒有“掛科”,而且在數(shù)字人視頻生成、3D內(nèi)容生成等方面令人驚艷,超出預(yù)期。
商湯版ChatGPT大語言模型“商量”,其多輪對話表現(xiàn)流暢,并有兩個細分領(lǐng)域的優(yōu)勢:問診與編程。編程助手可幫助開發(fā)者更高效地編寫和調(diào)試代碼;在健康咨詢方面,“商量”相當(dāng)于一個AI版的全科醫(yī)院分診臺,類似什么癥狀應(yīng)該看什么科室,可以為用戶提供個性化的醫(yī)療建議。此外,“商量”可以直接讀取PDF文件提取關(guān)鍵信息的功能也非常實用。
“秒畫SenseMirage”文生圖創(chuàng)作平臺,可支持6K高清圖的生成,還支持用戶自定義訓(xùn)練生成模型。
“如影SenseAvatar”AI數(shù)字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身,這將極大降低電商直播、在線教育等高頻應(yīng)用場景的人力成本。
“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺,可以高效低成本生成大規(guī)模三維場景和精細化的物件,能夠為元宇宙等虛實結(jié)合場景提供高品質(zhì)低成本的構(gòu)建技術(shù)。
第二重驅(qū)動,強化商湯已有的在CV、視覺感知領(lǐng)域的優(yōu)勢,加速AI技術(shù)落地。
在智能駕駛領(lǐng)域,基于視覺大模型,商湯開發(fā)了用于自動駕駛的BEV(Bird Eye View)感知算法,在Waymo挑戰(zhàn)賽上以絕對優(yōu)勢取得了冠軍。基于此算法,商湯開發(fā)了業(yè)界首個感知決策一體化的端到端自動駕駛解決方案UniAD,可以為自動駕駛多模態(tài)模型帶來更強的環(huán)境、行為、動機解碼能力。
據(jù)悉,“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務(wù),包括圖片生成,自然語言生成,視覺感知通用任務(wù)與標(biāo)注服務(wù)。通過調(diào)用API接口,企業(yè)用戶可以根據(jù)基模型進行微調(diào),低門檻、低成本、高效率地實現(xiàn)各類AI應(yīng)用。
3 從單點到平臺,轉(zhuǎn)型加速時
值得注意的是,在堅定投身“大裝置+大模型”路線之時,商湯自身也處在業(yè)務(wù)結(jié)構(gòu)轉(zhuǎn)型的關(guān)鍵時期。
目前,商湯的業(yè)務(wù)邊界早已不局限于CV領(lǐng)域,而是正在成為一家通用AI基礎(chǔ)平臺公司。而且在此過程中,“大裝置+大模型”沒有削弱CV領(lǐng)域原本的優(yōu)勢,反而是增強了。
從商湯對AI大裝置的定位“AGI時代基礎(chǔ)設(shè)施的領(lǐng)導(dǎo)者”,可以看出,昔日CV四小龍之首的商湯已今非昔比。對于行業(yè)邊界的突破,此前商湯科技董事長兼CEO 徐立曾經(jīng)這樣對媒體表示,“當(dāng)我們實現(xiàn)了從物理世界與數(shù)字世界的融合,AI就變成了基礎(chǔ)設(shè)施,人人都可以用,也就不用區(qū)分行業(yè)了。”
不過,業(yè)務(wù)結(jié)構(gòu)的變化是轉(zhuǎn)型更有力的證明。透過2022年年報,商湯的四大核心業(yè)務(wù)呈現(xiàn)“兩升兩降”的明顯改變。其中,智慧城市、智慧商業(yè)兩大板塊業(yè)務(wù)收入下滑,智慧生活、智慧汽車兩大新興業(yè)務(wù)大幅增長,顯示出業(yè)務(wù)結(jié)構(gòu)更加多元健康發(fā)展的態(tài)勢。
比如,2022年智慧生活業(yè)務(wù)收入同比增長129.9%,創(chuàng)歷史新高,占總收入比重從2021年的8.8%提升至25.1%。智慧生活業(yè)務(wù)涵蓋了AI內(nèi)容生成(AIGC)、AI傳感器、AI ISP芯片、智慧醫(yī)療等多個產(chǎn)品線,均實現(xiàn)了商業(yè)化突破。2022年智能汽車業(yè)務(wù)收入同比增長58.9%,占總收入比重從2021年的3.9%上升至7.7%。
“日日新來自《禮記·大學(xué)》,湯之盤銘曰‘茍日新、日日新、又日新’。也就是每天都要新,而且新的要更新。這代表人工智能大模型,在以周為單位的數(shù)據(jù)輸入上,可以日日更新,能力日日增強。”徐立在發(fā)布會上這樣解釋日日新的來歷。
2023年是國內(nèi)AI大模型的爆發(fā)元年,站在當(dāng)下的時間節(jié)點,我們可能很難預(yù)測未來AI大模型領(lǐng)域的市場格局是寡頭壟斷還是百花齊放。
因為,這是一場長期的、全方位的比拼,考驗著每一位入局者的資金儲備、戰(zhàn)略意志、技術(shù)能力等核心實力。
也許,每一位玩家無需也不可能做到大而全,集中資源聚焦最有差異化優(yōu)勢的大模型,才是突圍之道。
文中圖片來自攝圖網(wǎng)
END
本文為「智能進化論」原創(chuàng)作品,
歡迎關(guān)注。
原文標(biāo)題 : AI大模型內(nèi)卷加劇,商湯憑什么卷進來
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價拍賣
- 5 具身智能火了,但規(guī)模落地還需時間
- 6 國產(chǎn)英偉達們,抓緊沖刺A股
- 7 三次錯失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實力拉滿
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市