91免费看国产,亚洲日韩中文字幕无码专区,一个人吃我上面一个人吃不下

誰(shuí)率先摘到了大模型的果實(shí)？

2024-04-03 10:19

來(lái)源 | 伯虎財(cái)經(jīng)（bohuFN）

作者 | 陳平安

2022年底，OpenAI用chatGPT再度點(diǎn)燃了人工智能的狼煙，一場(chǎng)名為大模型的競(jìng)賽瞬間席卷了全球。

但到了今天，大家討論最多的不再是規(guī)模、算力。即便當(dāng)下AGI已經(jīng)成為了一種共識(shí)，行業(yè)大佬們言之鑿鑿：AGI很有可能在5年內(nèi)成為現(xiàn)實(shí)，但隨著大模型混戰(zhàn)進(jìn)入下半場(chǎng)，無(wú)論是投資人還是大廠，更關(guān)心的是如何率先讓大模型商業(yè)化成為可能。

3月26日，商湯集團(tuán)（下簡(jiǎn)稱“商湯”）發(fā)布截至 12 月 31 日的 2023 財(cái)年業(yè)績(jī)報(bào)告。其中一個(gè)值得注意的地方是，2023 年，商湯生成式 AI 業(yè)務(wù)收入達(dá) 12 億元。這也是商湯成立十年以來(lái)，最快達(dá)到10億收入體量的新業(yè)務(wù)。

作為此前國(guó)內(nèi)最炙手可熱的AI公司，商湯在生成式 AI 業(yè)務(wù)上的進(jìn)展，不僅僅意味著其本身正在走入新時(shí)代，對(duì)于正在尋求商業(yè)化的同行們來(lái)說，或許也能提供一些借鑒意義：

商湯是怎么做到的？

01 商業(yè)化閉環(huán)

和2022年相比，2023年商湯生成式 AI 業(yè)務(wù)的收入爆發(fā)式增長(zhǎng)200%，整體占比也從10% 增長(zhǎng)到 35%。

這得益于商湯對(duì)于生成式AI的戰(zhàn)略重視。

2023年，商湯把自身業(yè)務(wù)明確劃分為生成式 AI、傳統(tǒng) AI 和智能汽車，而此前的智慧城市、智慧商業(yè)和智慧生活中的非生成式AI業(yè)務(wù)，則被并入到傳統(tǒng)AI業(yè)務(wù)內(nèi)。商湯的愿景和戰(zhàn)略目標(biāo)也轉(zhuǎn)變?yōu)?ldquo;將 AGI 作為核心戰(zhàn)略目標(biāo)，以期在未來(lái)幾年內(nèi)實(shí)現(xiàn) AGI 技術(shù)的重大突破”。

這么做的原因是，生成式 AI 業(yè)務(wù)需要足夠聚焦的投入。在Scaling Law（尺度定律）的指引下，大量的投入是最基礎(chǔ)的事情。根據(jù)紐約時(shí)報(bào)援引對(duì)OpenAI創(chuàng)始人山姆.奧特曼的采訪，ChatGPT每天要消耗的電量就高達(dá)50萬(wàn)度。

OpenAI發(fā)布chatGPT后，商湯是反應(yīng)最迅速最持續(xù)的廠商之一。去年4月10日，商湯正式公布“日日新 SenseNova”大模型體系。到今年2月，日日新大模型已經(jīng)迭代了四個(gè)版本，來(lái)到了日日新 V4.0。據(jù)報(bào)道，日日新 V4.0在代碼編寫、數(shù)據(jù)分析、醫(yī)療問答等多個(gè)場(chǎng)景中達(dá)到與 GPT-4 相匹配的能力。

如果說對(duì)于大模型的持續(xù)投入是基礎(chǔ)，那么對(duì)于現(xiàn)實(shí)需求的準(zhǔn)確判斷則是商湯生成式 AI 業(yè)務(wù)迅猛發(fā)展的點(diǎn)金手。

目前包括手機(jī)、電腦、社交、醫(yī)療、金融等在內(nèi)的多個(gè)領(lǐng)域，AI都是行業(yè)發(fā)展和競(jìng)爭(zhēng)的重要比拼維度。比如智能手機(jī)行業(yè)，一個(gè)能夠聽取用戶的指令，并調(diào)用手機(jī)上的各類應(yīng)用程序完成復(fù)雜任務(wù)的智能終端模型已經(jīng)被放到了重要賣點(diǎn)。

但由于訓(xùn)練通用大模型的成本太高，更多的廠商們更傾向于通過直接調(diào)取API的方式來(lái)獲得生成式AI的能力。

商湯新的「模型即服務(wù)」（MaaS）的商業(yè)模式正好適配這股暴漲的需求。通過在大裝置微調(diào)和調(diào)用各類生成式 AI 能力，客戶不需要自己去搭建基礎(chǔ)設(shè)施，大大降低了成本。

一般來(lái)說，場(chǎng)景有三個(gè)：一是公有云標(biāo)準(zhǔn)，調(diào)用 API；二是私有云，對(duì)于安全需求客戶提供專屬模型和模型授權(quán)服務(wù)；三是模型定制服務(wù)。

比如包括招商銀行、中國(guó)銀行等在內(nèi)的多家知名銀行已經(jīng)采用日日新大模型去構(gòu)建數(shù)字客服系統(tǒng)；鄭州大學(xué)第一附屬醫(yī)院、上海交通大學(xué)醫(yī)學(xué)院附屬新華醫(yī)院、上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院等，選擇運(yùn)用“大醫(yī)”賦能用藥咨詢、患者隨訪、臨床輔助決策等眾多醫(yī)院真實(shí)業(yè)務(wù)場(chǎng)景。

財(cái)報(bào)提到，在企業(yè)端，生成式 AI 業(yè)務(wù)中超過 70% 的客戶是商湯在過去一年內(nèi)的新增客戶，而剩下 30% 的存量客戶的客單價(jià)也錄得了約 50% 的增速。在C端，日日新大模型賦能 C 端的調(diào)用量更是在半年內(nèi)增長(zhǎng)近120倍。

生成式 AI 業(yè)務(wù)的發(fā)展也推動(dòng)了傳統(tǒng)AI業(yè)務(wù)和智能汽車業(yè)務(wù)的變革。以智能汽車業(yè)務(wù)為例，作為AI技術(shù)和傳統(tǒng)制造結(jié)合的最大落地場(chǎng)景，大模型的影響力也在持續(xù)。隨著特斯拉在美國(guó)推送智能駕駛軟件FSD v12 Beta版，基于大模型架構(gòu)的端到端技術(shù)方案成為了下一代自動(dòng)駕駛的最優(yōu)解。

得益于自家大模型的基礎(chǔ)能力，商湯的“絕影”智能汽車業(yè)務(wù)迎來(lái)了迅速增長(zhǎng)：量產(chǎn)交付同比大幅增長(zhǎng)163%，營(yíng)收同比增長(zhǎng)31%。

不過無(wú)論是大模型能力的訓(xùn)練，還是端側(cè)大模型的部署，都是一個(gè)長(zhǎng)期且困難的事，商湯大舉投入的底氣在哪？

02 AI2.0的賽點(diǎn)

在科技行業(yè)的語(yǔ)境里，AI并不是一個(gè)新詞。

以2017年Transformer算法的誕生為分界線，AI被劃分為兩個(gè)時(shí)期。前者多聚焦于參數(shù)量較小的小模型，針對(duì)特定場(chǎng)景獲得特定能力，后者則更通用，更基礎(chǔ)。

但這并不意味著，過去企業(yè)在AI1.0時(shí)代的積累和經(jīng)驗(yàn)，無(wú)法在AI2.0時(shí)代發(fā)揮作用。恰恰相反，商湯過去在感知智能、決策智能等方面的積累，是其生成式AI業(yè)務(wù)得以快速發(fā)展的關(guān)鍵之一。

一方面，AI1.0時(shí)代，商湯不僅在計(jì)算機(jī)視覺方面積累了大量算法模型，覆蓋從視覺信號(hào)的分析理解到實(shí)現(xiàn)數(shù)字內(nèi)容的生成等各方面；也自研并具備了包括語(yǔ)音識(shí)別(ASR)、語(yǔ)義理解（NLP/ 知識(shí)圖譜）、語(yǔ)音合成（TTS）以及語(yǔ)音動(dòng)畫合成（STA）等多項(xiàng)技術(shù)能力。這些都能有效強(qiáng)化其基礎(chǔ)模型對(duì)物理世界的理解和多模態(tài)能力。

比如在智能終端領(lǐng)域，得益于商湯在小模型上的積累，同樣是7B模型，商湯的性能領(lǐng)先于Meta的Llama2和谷歌的Gemma。2023年，高通、MTK在發(fā)布會(huì)上展示了商湯子公司慧鯉生成式AI端側(cè)模型在其旗艦芯片上的應(yīng)用成果：商湯的7B級(jí)小型模型在高通最新款芯片上，實(shí)現(xiàn)了業(yè)界領(lǐng)先的16tokens/秒的推理速度。

另一方面，在大力發(fā)展生成式AI業(yè)務(wù)之前，商湯的AI能力就賦能了不少垂直行業(yè)：包括智慧城市、智慧商業(yè)、智能汽車和智慧生活等在內(nèi)的四大板塊，涉及了20多個(gè)落地場(chǎng)景，其中不乏我們熟悉的手機(jī)、金融、醫(yī)療等。這讓商湯更能洞察當(dāng)下各行各業(yè)對(duì)于生成式AI的需求到底在何處，如何針對(duì)需求去做供給。

更重要的是，過去商湯在基礎(chǔ)設(shè)施上的前瞻布局，正在發(fā)揮巨大作用。

如果說工業(yè)革命時(shí)代的基礎(chǔ)設(shè)施是電力、鐵路、運(yùn)河、港口，那么大模型時(shí)代的基礎(chǔ)設(shè)施則是以GPU為代表的算力。OpenAI首席執(zhí)行官奧特曼曾表示，“算力是這個(gè)時(shí)代最重要的貨幣”。這既關(guān)乎成本，也關(guān)乎效率。

早在2018年，商湯就著手自建算力中心，并在此基礎(chǔ)上打造了SenseCore AI大裝置。2022年，商湯在上海臨港的智算中心AIDC正式運(yùn)營(yíng)，是亞洲最大的人工智能計(jì)算中心之一，并在2023年擴(kuò)展了上海、深圳、廣州、福州、濟(jì)南、重慶等新的計(jì)算節(jié)點(diǎn)。

業(yè)績(jī)公告顯示，商湯大裝置總算力達(dá)到12000petaFLOPS，相較于2023年初提高了一倍，GPU數(shù)量達(dá)到45000卡，實(shí)現(xiàn)了萬(wàn)卡萬(wàn)參的大模型訓(xùn)練能力。

算力只是商湯大裝置的計(jì)算基礎(chǔ)設(shè)施，在此之上還包括模型層、深度學(xué)習(xí)層兩個(gè)架構(gòu)，分別對(duì)應(yīng)算法模型生成和算法模型訓(xùn)練。

為了提高算力的供給效率，商湯聯(lián)合開發(fā)了DeepLink開放計(jì)算體系。基于此，各類國(guó)產(chǎn)芯片可以輕松適配主流的大模型訓(xùn)練框架和算法庫(kù)。今年，商湯還增加了對(duì)華為昇騰、寒武紀(jì)等主流國(guó)產(chǎn)芯片的適配，支持大模型的訓(xùn)練、微調(diào)和推理服務(wù)，從而通過提供規(guī)�；�、高效率、集約化的算力基礎(chǔ)設(shè)施服務(wù)，大幅提高算力的利用能力。

簡(jiǎn)單來(lái)說，就是降本增效。

根據(jù)報(bào)道，目前商湯大裝置在大模型訓(xùn)練服務(wù)上可以保持90%的加速效率，提供30天穩(wěn)定訓(xùn)練不間斷的服務(wù)，并將出現(xiàn)訓(xùn)練間斷時(shí)的診斷恢復(fù)時(shí)長(zhǎng)也優(yōu)化到了半小時(shí)。

同時(shí)，商湯大裝置還支持20個(gè)億參數(shù)量超大模型（以千卡并行）并行訓(xùn)練，并新增了對(duì)多模態(tài)模型和混合專家模型的支持。

這也是為什么商湯可以頂住壓力，成為少數(shù)可以高速迭代大模型的企業(yè)之一。自 2023 年發(fā)布以來(lái)，商湯“日日新”大模型的能力每隔三個(gè)月都會(huì)有顯著提升。根據(jù)弗若斯特沙利文發(fā)布的《AI大模型市場(chǎng)研究報(bào)告(2023)》，商湯的AI大模型在產(chǎn)品技術(shù)、戰(zhàn)略愿景、生態(tài)開放構(gòu)建等綜合競(jìng)爭(zhēng)力，在2023年位列國(guó)內(nèi)第一。

03 共創(chuàng)的未來(lái)

IDC最新發(fā)布的2024年V1版《全球人工智能和生成式人工智能支出指南》顯示，無(wú)論是投資規(guī)模還是市場(chǎng)規(guī)模，AI行業(yè)都處于高速增長(zhǎng)當(dāng)中。

2022年全球人工智能（AI）的IT總投資規(guī)模為1324.9億美元。預(yù)計(jì)到2027年，這一數(shù)字將增至5124.2億美元，年復(fù)合增長(zhǎng)率為31.1%。特別是生成式AI技術(shù)，預(yù)計(jì)到2027年將占據(jù)33.0%的中國(guó)AI市場(chǎng)投資份額。

IDC還特別提及了生成式AI市場(chǎng)的年復(fù)合增長(zhǎng)率可能達(dá)到85.7%，到2027年，全球生成式AI市場(chǎng)規(guī)模將接近1500億美元。

但正如紅杉中國(guó)去年發(fā)布的一篇文章所預(yù)測(cè)，當(dāng)下AI浪潮的重心是如何利用新技術(shù)端到端地解決現(xiàn)實(shí)社會(huì)中的問題：模型能力和商業(yè)化路徑本就是一體兩面的關(guān)系。這既有賴于共創(chuàng)，也需要自身的努力。

這恰是商湯潛力的體現(xiàn)。

根據(jù)財(cái)報(bào)，商湯大裝置的降本增效能力已賦能多個(gè)領(lǐng)域頭部企業(yè)機(jī)構(gòu)，其中既包括小米、閱文等行業(yè)“燈塔”，也有上海交大等頂尖機(jī)構(gòu)。

“大裝置+大模型”的深度協(xié)同優(yōu)勢(shì)也讓商湯可以在保持技術(shù)優(yōu)勢(shì)的同時(shí)，把技術(shù)賦能到其他行業(yè)。根據(jù)官方透露，商湯將于今年4月的技術(shù)交流日上，推出“日日新”大模型5.0版本，預(yù)期其多模態(tài)能力將對(duì)標(biāo)GPT4V。

簡(jiǎn)單來(lái)說，當(dāng)下商湯既是“電”的提供人，也是“鐵路”的鋪設(shè)者。

正如商湯董事長(zhǎng)兼 CEO 徐立所言，“生成式 AI 對(duì)商湯來(lái)說已不僅僅是技術(shù)領(lǐng)域的變革性創(chuàng)新，更成為公司的核心業(yè)務(wù)。商湯生成式 AI 業(yè)務(wù)的增長(zhǎng)，得益于各行各業(yè)對(duì)大模型的訓(xùn)練和推理的廣泛需求，這預(yù)示著中國(guó)硬科技投資的新周期正式開啟。商湯通過在各業(yè)務(wù)層面深入融合生成式 AI 能力，正在贏得新客戶，并推動(dòng)效率和生產(chǎn)力的全面提升。”

商湯唯一需要做的，就是把當(dāng)下的路堅(jiān)持下去。

*文章封面首圖及配圖，版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無(wú)償使用，請(qǐng)及時(shí)聯(lián)系我們，本平臺(tái)將立即更正。

原文標(biāo)題 : 誰(shuí)率先摘到了大模型的果實(shí)？