訂閱
糾錯
加入自媒體

AI大模型內(nèi)卷加劇,商湯憑什么卷進來

作者|小葳

出品|智能進化論

2023年,國內(nèi)大模型何其多。

目前,已宣布推出或即將推出大模型的國內(nèi)企業(yè)多達20余家,基本上能想到的相關(guān)企業(yè)都已入局。其中,既有資金雄厚的BAT、華為、字節(jié)等大廠,也有王慧文、王小川、周伯文等互聯(lián)網(wǎng)大佬領(lǐng)銜的初創(chuàng)企業(yè),還有垂直領(lǐng)域的AI企業(yè),比如商湯科技、科大訊飛等。

4月10日,商湯推出“日日新SenseNova”大模型體系,包括一系列生成式AI模型:大語言模型“商量”、文生圖AI平臺“秒畫”、AI數(shù)字人視頻生成平臺“如影”、3D內(nèi)容生產(chǎn)平臺“瓊宇”、“格物”,以及大模型數(shù)據(jù)標(biāo)注平臺“明眸”。

在大模型的輿論場上,商湯并不高調(diào),而是直接搬出全套大模型產(chǎn)品,并迅速開放面向企業(yè)的試用通道。從發(fā)布會現(xiàn)場實時演示的效果看,商湯大模型的實力不容小覷。“一個專注CV的公司能在LLM上做出如此高成熟度產(chǎn)品,其開發(fā)團隊令人起敬。”一名知乎網(wǎng)友的觀點代表了一部分外界聲音。

同時,一些質(zhì)疑的聲音也出現(xiàn)了,比如有觀點認(rèn)為專注機器視覺賽道(CV)的獨角獸AI企業(yè)到底有沒有必要湊熱鬧搞大模型。畢竟大模型需要長期巨量燒錢,目前商業(yè)化模式有限,這會讓尚未盈利的AI企業(yè)面臨更大的虧損壓力。

那么,如何看待商湯進軍多模態(tài)大模型領(lǐng)域的布局?在日益擁擠的“中國版ChatGPT”競爭中,商湯又將走出怎樣與眾不同的生態(tài)位呢?

1 從大裝置到大模型,始終指向同一目標(biāo)

當(dāng)ChatGPT推動AI行業(yè)走過“iPhone時刻”,大模型的通用性已經(jīng)得到了成功驗證。

更重要的是,今年3月微軟發(fā)布的一篇論文指出,“GPT-4已經(jīng)可以被視為通用人工智能的一個早期的版本。”這一觀點也得到了相當(dāng)多專業(yè)人士的認(rèn)可。深度學(xué)習(xí)之父Geoffrey Hinton為代表的一些頂級科學(xué)家認(rèn)為,通用人工智能(AGI)不再遙不可及,而有可能在數(shù)十年內(nèi)逐步實現(xiàn)。

接下來,在大模型這一確定性的方向上,中外AI企業(yè)如何摸索出適合自己的道路,成為關(guān)鍵命題。

商湯對這個問題的答案是:堅定地走“大裝置+大模型”的道路。

了解商湯戰(zhàn)略的朋友會知道,商湯此時推出大模型并不是跟風(fēng),而是自身在持續(xù)解決AI規(guī);涞氐缆飞系挠忠粋關(guān)鍵節(jié)點。

此前,AI落地難的核心原因是一個場景一個模型的開發(fā)模式,導(dǎo)致落地成本高,模型復(fù)用率低,難以規(guī)模化標(biāo)準(zhǔn)化。彼時,2020年問世的千億參數(shù)的GPT3已經(jīng)為大模型的通用性帶來一定突破。商湯的解法同理,向下層基礎(chǔ)設(shè)施扎根,希望用龐大的參數(shù)量×數(shù)據(jù)量跑出通用性。

2021年,商湯推出AI大裝置SenseCore,并在2022年完成重要擴建。AI大裝置可以理解為大算力基礎(chǔ)設(shè)施+大模型即服務(wù)(Model as a Service)。

目前AI大裝置構(gòu)建了27000塊GPU構(gòu)成的并行計算系統(tǒng),實現(xiàn)了5.0exaFLOPS的算力輸出,是亞洲目前最大的智能計算平臺之一。商湯AI大裝置上的算力可以同步支持20個千億規(guī)模參數(shù)量的超大模型,并且以千卡規(guī)模來同時訓(xùn)練。

同時,AI大裝置還對外提供大模型即服務(wù),包括自動化數(shù)據(jù)標(biāo)注、大模型并行訓(xùn)練、推理部署等等。目前AI大裝置最大的集群由4000塊芯片并聯(lián)組成,可以訓(xùn)練參數(shù)量超5000億的稠密模型,今年的目標(biāo)是能夠訓(xùn)練超過萬億參數(shù)的大模型。

投入這么大,AI大裝置的應(yīng)用情況如何呢?

2022年,商湯將AI大裝置的能力向行業(yè)客戶開放,通過提供高性能計算資源、豐富的預(yù)訓(xùn)練模型庫、易用的開發(fā)工具和專業(yè)技術(shù)支持,幫助客戶高效訓(xùn)練大模型。目前已經(jīng)有超過10個大模型研發(fā)任務(wù)得以實現(xiàn),涵蓋了視覺、語言、多模態(tài)等領(lǐng)域的用戶自定義大模型開發(fā)。

面向企業(yè)開放后,AI大裝置已經(jīng)有了規(guī)模化的營收。根據(jù)商湯2022年年報,2022年AI大裝置對外服務(wù)產(chǎn)生的收入占比智慧商業(yè)(商湯四大業(yè)務(wù)板塊之一)整體收入超20%。按照2022年智慧商業(yè)收入14.64億元計算,AI大裝置已經(jīng)為商湯帶來近3億元營收。

看到這里你也許有些明白了,商湯并不是從零開始構(gòu)建大模型的。之所以能在短期內(nèi)迅速推出多種類型的大模型,離不開AI大裝置這個根基。而且實際上,商湯在大模型領(lǐng)域的布局要早于AI大裝置。

在最擅長的CV領(lǐng)域,2019年商湯就發(fā)布了10億參數(shù)的視覺大模型。2022年,商湯的視覺大模型已經(jīng)進化到了320億參數(shù),也是世界上迄今為止最大的視覺模型。

自2021年起,商湯科技開始自研NLP大模型和多模態(tài)模型。在NLP領(lǐng)域,商湯的大語言模型達到了千億參數(shù)級別。

在多模態(tài)領(lǐng)域, 2022年3月,商湯科技聯(lián)合上海人工智能實驗室、清華大學(xué)、香港中文大學(xué)、上海交通大學(xué)發(fā)布了多模態(tài)多任務(wù)通用大模型“書生(INTERN)”,擁有30億參數(shù)。書生大模型已經(jīng)在通用視覺開源平臺OpenGVLab開源,是目前開源模型社區(qū)性能最強的多模態(tài)大模型。

在AIGC領(lǐng)域,商湯推出10億參數(shù)的AIGC模型,能夠支持文生圖和圖生圖的各種功能。曾在星際爭霸的比賽中超越DeepMind的AlphaStar的商湯決策智能模型,未來也將融入到多模態(tài)大模型中。

“未來商湯的通用人工智能大模型體系會覆蓋視覺感知、語言理解、內(nèi)容生成和推理決策四大方面。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。

目前,商湯的大模型已在在智慧城市、智慧商業(yè)、智能汽車和智慧生活四大板塊20多個場景實現(xiàn)了落地交付。比如,在自動駕駛領(lǐng)域,商湯在視覺大模型領(lǐng)域研發(fā)的BEVFormer++感知算法以絕對優(yōu)勢贏得了2022年Waymo挑戰(zhàn)賽主賽道冠軍。

綜上,商湯做大模型的目標(biāo)不是去搶奪面向個人用戶的“中國版ChatGPT”的噱頭,而是用“大裝置+大模型”加速AI商業(yè)化落地。

2 “日日新”的雙重驅(qū)動力

“AGI催生了新的研究范式,即基于一個強大的多模態(tài)基模型,通過強化學(xué)習(xí)和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務(wù)。AGI將實現(xiàn)從‘數(shù)據(jù)飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。”商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示。

具體到商湯“日日新”大模型,「智能進化論」認(rèn)為,其對于商湯而言至少有兩大方面的驅(qū)動力:

第一重驅(qū)動,通過豐富的AIGC大模型向外賦能,包括通過開放API的形式,降低各行各業(yè)應(yīng)用大模型的門檻;

目前商湯“日日新”系列大模型僅面向企業(yè)用戶開放試用。不過,從發(fā)布會實時演示來看,“日日新”大模型給人的初步印象是:整體能力全面,相當(dāng)于沒有“掛科”,而且在數(shù)字人視頻生成、3D內(nèi)容生成等方面令人驚艷,超出預(yù)期。

商湯版ChatGPT大語言模型“商量”,其多輪對話表現(xiàn)流暢,并有兩個細分領(lǐng)域的優(yōu)勢:問診與編程。編程助手可幫助開發(fā)者更高效地編寫和調(diào)試代碼;在健康咨詢方面,“商量”相當(dāng)于一個AI版的全科醫(yī)院分診臺,類似什么癥狀應(yīng)該看什么科室,可以為用戶提供個性化的醫(yī)療建議。此外,“商量”可以直接讀取PDF文件提取關(guān)鍵信息的功能也非常實用。

“秒畫SenseMirage”文生圖創(chuàng)作平臺,可支持6K高清圖的生成,還支持用戶自定義訓(xùn)練生成模型。

“如影SenseAvatar”AI數(shù)字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身,這將極大降低電商直播、在線教育等高頻應(yīng)用場景的人力成本。

“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺,可以高效低成本生成大規(guī)模三維場景和精細化的物件,能夠為元宇宙等虛實結(jié)合場景提供高品質(zhì)低成本的構(gòu)建技術(shù)。

第二重驅(qū)動,強化商湯已有的在CV、視覺感知領(lǐng)域的優(yōu)勢,加速AI技術(shù)落地。

在智能駕駛領(lǐng)域,基于視覺大模型,商湯開發(fā)了用于自動駕駛的BEV(Bird Eye View)感知算法,在Waymo挑戰(zhàn)賽上以絕對優(yōu)勢取得了冠軍。基于此算法,商湯開發(fā)了業(yè)界首個感知決策一體化的端到端自動駕駛解決方案UniAD,可以為自動駕駛多模態(tài)模型帶來更強的環(huán)境、行為、動機解碼能力。

據(jù)悉,“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務(wù),包括圖片生成,自然語言生成,視覺感知通用任務(wù)與標(biāo)注服務(wù)。通過調(diào)用API接口,企業(yè)用戶可以根據(jù)基模型進行微調(diào),低門檻、低成本、高效率地實現(xiàn)各類AI應(yīng)用。

 

3 從單點到平臺,轉(zhuǎn)型加速時

值得注意的是,在堅定投身“大裝置+大模型”路線之時,商湯自身也處在業(yè)務(wù)結(jié)構(gòu)轉(zhuǎn)型的關(guān)鍵時期。

目前,商湯的業(yè)務(wù)邊界早已不局限于CV領(lǐng)域,而是正在成為一家通用AI基礎(chǔ)平臺公司。而且在此過程中,“大裝置+大模型”沒有削弱CV領(lǐng)域原本的優(yōu)勢,反而是增強了。

從商湯對AI大裝置的定位“AGI時代基礎(chǔ)設(shè)施的領(lǐng)導(dǎo)者”,可以看出,昔日CV四小龍之首的商湯已今非昔比。對于行業(yè)邊界的突破,此前商湯科技董事長兼CEO 徐立曾經(jīng)這樣對媒體表示,“當(dāng)我們實現(xiàn)了從物理世界與數(shù)字世界的融合,AI就變成了基礎(chǔ)設(shè)施,人人都可以用,也就不用區(qū)分行業(yè)了。”

不過,業(yè)務(wù)結(jié)構(gòu)的變化是轉(zhuǎn)型更有力的證明。透過2022年年報,商湯的四大核心業(yè)務(wù)呈現(xiàn)“兩升兩降”的明顯改變。其中,智慧城市、智慧商業(yè)兩大板塊業(yè)務(wù)收入下滑,智慧生活、智慧汽車兩大新興業(yè)務(wù)大幅增長,顯示出業(yè)務(wù)結(jié)構(gòu)更加多元健康發(fā)展的態(tài)勢。

比如,2022年智慧生活業(yè)務(wù)收入同比增長129.9%,創(chuàng)歷史新高,占總收入比重從2021年的8.8%提升至25.1%。智慧生活業(yè)務(wù)涵蓋了AI內(nèi)容生成(AIGC)、AI傳感器、AI ISP芯片、智慧醫(yī)療等多個產(chǎn)品線,均實現(xiàn)了商業(yè)化突破。2022年智能汽車業(yè)務(wù)收入同比增長58.9%,占總收入比重從2021年的3.9%上升至7.7%。

“日日新來自《禮記·大學(xué)》,湯之盤銘曰‘茍日新、日日新、又日新’。也就是每天都要新,而且新的要更新。這代表人工智能大模型,在以周為單位的數(shù)據(jù)輸入上,可以日日更新,能力日日增強。”徐立在發(fā)布會上這樣解釋日日新的來歷。

2023年是國內(nèi)AI大模型的爆發(fā)元年,站在當(dāng)下的時間節(jié)點,我們可能很難預(yù)測未來AI大模型領(lǐng)域的市場格局是寡頭壟斷還是百花齊放。

因為,這是一場長期的、全方位的比拼,考驗著每一位入局者的資金儲備、戰(zhàn)略意志、技術(shù)能力等核心實力。

也許,每一位玩家無需也不可能做到大而全,集中資源聚焦最有差異化優(yōu)勢的大模型,才是突圍之道。

 文中圖片來自攝圖網(wǎng)

END

本文為「智能進化論」原創(chuàng)作品,

歡迎關(guān)注。

       原文標(biāo)題 : AI大模型內(nèi)卷加劇,商湯憑什么卷進來

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號