訂閱
糾錯
加入自媒體

AI大模型搶灘手機端?新巨頭何時誕生

 

導(dǎo)

8月14日,雷軍宣布小米科技戰(zhàn)略升級,并公布了升級后的科技理念:選擇對人類文明有長期價值的技術(shù)領(lǐng)域,堅持長期持續(xù)投入。

“深耕底層技術(shù),長期持續(xù)投入,軟硬深度融合,AI全面賦能”,這是小米科技戰(zhàn)略升級的四個關(guān)鍵路徑與原則。雷軍表示,軟件硬件深度融合,是為用戶提供獨特體驗的根本保證,而AI則是未來的生產(chǎn)力,也是小米長期持續(xù)投入的底層賽道之一。

自2016年組建AI團隊至今,小米人工智能團隊人員規(guī)模已達3000多人。今年4月小米組建了AI大模型團隊,8月14日晚,雷軍正式宣布了小米的大模型戰(zhàn)略:全面擁抱大模型。據(jù)悉,小米旗下的智能語音助手小愛同學(xué)將接入大模型能力,并于14日開啟邀請內(nèi)測。

雷軍稱,小米大模型技術(shù)的重點突破方向為“輕量化、本地部署”,小米考慮的是優(yōu)先在手機上實現(xiàn)端側(cè)跑通,讓每個人都能更好在手機上使用大模型。

面對新一輪產(chǎn)業(yè)與技術(shù)變革帶來的時代巨變,大巨頭公司也好、小巨人企業(yè)也罷,都紛紛入局大模型賽道。當(dāng)前“百模大戰(zhàn)”進展到什么階段,本文可以為您提供參考。

 來源 | 零壹智庫

2023年以來,科技圈最熱的詞語就是ChatGPT及其背后的大模型技術(shù)。

此前有百度文心一言、阿里云通義千問、華為盤古、科大訊飛星火等,近期李開復(fù)入局建立零一萬物、火山引擎推出“火山方舟”。短短數(shù)月,各類企業(yè)研發(fā)和發(fā)布大模型應(yīng)用已成潮流。

國內(nèi)10億級參數(shù)規(guī)模以上大模型已超80個,并且還在快速增加。一場圍繞大模型的商業(yè)戰(zhàn)爭的備戰(zhàn)氛圍已經(jīng)極為濃厚。

大巨頭公司也好,小巨人企業(yè)也罷,都需要這樣的動作展現(xiàn)自身對前沿科技的敏感度與長期以來的積累。早一步推出應(yīng)用,便可早一日測試大模型與用戶交互上的寶貴數(shù)據(jù),在未來競爭中“廣積糧,圖稱王”。

大模型的關(guān)鍵的還是AI領(lǐng)域要素——算法、算力、數(shù)據(jù),以及場景/應(yīng)用。算法代表策略,算力決定上限也設(shè)置了門檻,數(shù)據(jù)等同軍糧也象征著優(yōu)劣之分。三要素之外,場景/應(yīng)用代表出兵方向。

 “百模大戰(zhàn)”爆發(fā),要素齊備的巨頭公司是否會演變成技術(shù)能力的無限內(nèi)卷?垂直賽道的小巨頭能否借助大模型夯實自己的領(lǐng)先地位?在獲得門票的新玩家中,誰有可能是行業(yè)統(tǒng)治地位的有力競爭者?

 01 

通用大模型“實力分水嶺”未現(xiàn)

大模型的玩家主要分為三類:一是在資源與場景上具備身位優(yōu)勢的互聯(lián)網(wǎng)(百度、阿里、騰訊等)和產(chǎn)業(yè)巨頭(中國電信與中國聯(lián)通等),二是專研AI的人工智能公司(商湯、云從、光年之外等),最后一類則是以上海人工智能實驗室、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)等為代表的科研院所單位。

根據(jù)公開數(shù)據(jù),截至2023年7月初,我國10億級參數(shù)規(guī)模以上大模型已超80個,且還在快速增加。該參數(shù)量的大模型越多,標(biāo)志著競爭門檻將逐步拔高。

目前已經(jīng)發(fā)布的大模型絕大多數(shù)屬于通用大模型,原因主要有兩種:一是大模型競爭尚不明朗,純粹技術(shù)層面并未拉開代差,行業(yè)參與者都有機會稱霸江湖;二是面向公眾的應(yīng)用型大模型仍未出現(xiàn),缺乏較為明確的方向指引,在國內(nèi)大模型的“Chat GPT時刻”出現(xiàn)前,投身通用大模型是既主動又被動的無奈之選。

何況,大模型領(lǐng)域極有可能走出一個新巨頭。

周鴻祎認為,大模型必須“通用”,只有通用才能走進千家萬戶、賦能百行千業(yè),進而主導(dǎo)人工智能新革命。

話中未盡之處是,需要多少投入和配合才能成為引領(lǐng)新革命的主導(dǎo)者。不管大模型是藍海還是紅海市場,必然要存在大魚領(lǐng)銜、小魚配合的生態(tài)結(jié)構(gòu),而目前大魚和小魚之間的實力分水嶺仍未出現(xiàn)。

以當(dāng)前局勢看,10億參數(shù)規(guī)模的大模型可以視為入局門檻,100億參數(shù)規(guī)模的大模型可認為具備逐鹿天下的能力,但即使是1000億參數(shù)規(guī)模的大模型也遠未達到一騎絕塵的領(lǐng)先水平。

參數(shù)量并非決定戰(zhàn)場局勢的壓倒性力量,資源調(diào)度能力、長期經(jīng)驗積累、大額科研投入等因素都是大模型競爭中長期存在的核心差異點。

要對標(biāo)Open AI,需要看清Chat GPT爆發(fā)背后是微軟在數(shù)據(jù)、算力、海量資金上的全面支持,才有了之后的厚積薄發(fā)。

大模型是長期投入的行業(yè),簡單來說就是“燒錢”。算力、算法與數(shù)據(jù)的積累非一夕之功,模型發(fā)布之后還需要反復(fù)訓(xùn)練、敏捷迭代,最終不斷演變?yōu)?ldquo;成熟體”。

放到現(xiàn)實環(huán)境下,大模型的玩家是技術(shù)驅(qū)動還是利益驅(qū)動?Open AI是當(dāng)下全球最知名的大模型公司,即便手握Chat GPT這一爆款產(chǎn)品,其商業(yè)化能力仍然堪憂。作為一家逼近300億美元市值的科技企業(yè),2023年身處AI浪潮中心,Open AI至今收入仍不過2億美元。

初期投入只是起始花費,之后每一次訓(xùn)練都需要真金白銀往里砸,有多少公司能否接受大模型競爭中那少得可憐的投資回報率?Chat GPT的成功,證明了大模型在產(chǎn)品路徑上的打通,但并不意味著商業(yè)層面的巨大成功。

至少在投入產(chǎn)出比層面,互聯(lián)網(wǎng)巨頭相對優(yōu)勢更大,他們有足夠的動力和資源去支撐前期的戰(zhàn)略性虧損,一如當(dāng)年的阿里云。

至于到底燒錢要燒多久,何時才能看到喜人的投資回報,大公司不知道,創(chuàng)業(yè)公司的VC也不知道。這是一場隨時可能離場的豪賭,而籌碼動輒數(shù)十億美金。

對于“人有我優(yōu)”的大模型玩家而言,優(yōu)先探索應(yīng)用層,及早開放測試,誰能積累更為珍貴的交互數(shù)據(jù),將是接下來競爭的破局點。

 02 

垂直之需與垂直之困

通用大模型的角逐,更多是基礎(chǔ)設(shè)施制定權(quán)的爭奪,而垂直大模型,則是在特定場景中依托開源大模型或API接口,在細分行業(yè)形成差異化競爭能力,更多聚焦在場景應(yīng)用。

在通用大模型的戰(zhàn)場上,隨著時間推進,一些力有不逮的玩家會逐步掉隊,最終只會存在寥寥數(shù)個通用大模型,起到基礎(chǔ)設(shè)施的作用。同時,這些大模型還面臨著同質(zhì)化問題,應(yīng)用層仍然要靠垂直大模型發(fā)力。

通用大模型像是多個垂直大模型的集合,訓(xùn)練場景越多,通用大模型的“通用性”越強。

作為國內(nèi)最早發(fā)布類Chat GPT產(chǎn)品的公司,百度對大模型垂直應(yīng)用層的需求十分緊迫。李彥宏表示:“比大模型數(shù)量更重要的是應(yīng)用,是在垂直領(lǐng)域應(yīng)用的突破。新的國際競爭戰(zhàn)略關(guān)鍵點,不是有多少個大模型,而是大模型上有多少原生的應(yīng)用,這些應(yīng)用在多大程度上提升了生產(chǎn)效率。”

按照李彥宏的比喻,大模型尤其是通用大模型就像是AI時代的操作系統(tǒng),所有的應(yīng)用都將圍繞著大模型開發(fā),其上是應(yīng)用層,包括各種各樣的AI原生應(yīng)用。

歸根結(jié)底,所謂的“通用”只是一個相對概念,并不存在完全適用于所有領(lǐng)域、具備足夠行業(yè)深度的通用大模型。以Chat GPT為例,真正得以廣泛應(yīng)用的仍是一些容錯率較高的行業(yè),即便大模型給出的解決方案出錯,錯誤也局限在較為有限的范圍內(nèi)。而在重工業(yè)、航天、醫(yī)療等場景中,一次錯誤所造成的損失不可估量,即Chat GPT不能滿足特定場景的垂直性、專業(yè)性要求。

要兼顧垂直性與專業(yè)性要求,數(shù)據(jù)是硬傷,數(shù)據(jù)深度足夠且能形成穩(wěn)定護城河的行業(yè)更少。這些行業(yè)的數(shù)據(jù)是否便于獲得,已經(jīng)獲得的數(shù)據(jù)能否滿足特定行業(yè)日新月異的要求,都很難具體評定。

互聯(lián)網(wǎng)巨頭擁有大量電商、社交、搜索等網(wǎng)絡(luò)數(shù)據(jù),但數(shù)據(jù)類型不夠全面,數(shù)據(jù)質(zhì)量也沒有保障,中文可供訓(xùn)練的語料還需要做大量的挖掘工作。

近期在政務(wù)、公共安全、醫(yī)療等領(lǐng)域,垂直大模型正在陸續(xù)落地。例如,云知聲在智慧醫(yī)療領(lǐng)域自研“山海”大模型,結(jié)合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術(shù),預(yù)計可提升醫(yī)生的電子病歷錄入效率超過400%,節(jié)約單個患者問診時間超過40%,提升醫(yī)生門診效率超過66%。

拓爾思基于自有的公文、政策文件、政務(wù)辦事指南等數(shù)據(jù)作為專業(yè)訓(xùn)練數(shù)據(jù),打造了政務(wù)專業(yè)大模型。

金融領(lǐng)域內(nèi),恒生電子2023年3月底開始籌劃、設(shè)計金融大模型產(chǎn)品。6月末,恒生電子和旗下子公司恒生聚源發(fā)布基于大語言模型技術(shù)打造的數(shù)智金融新品——金融智能助手光子和全新升級的智能投研平臺WarrenQ,恒生電子金融行業(yè)大模型LightGPT也首次對外亮相。

騰訊這種具備多個行業(yè)資源的互聯(lián)網(wǎng)巨頭則是多面下注。在6月下旬,騰訊公布的MaaS服務(wù)解決方案覆蓋了金融、文旅、政務(wù)、教育等10個行業(yè),共有超50個解決方案。

同時,垂直大模型所需要的數(shù)據(jù)往往并不局限在本行業(yè),某些業(yè)務(wù)也許需要另一個或多個行業(yè)的數(shù)據(jù)整合,其模型訓(xùn)練和應(yīng)用就依賴于企業(yè)的跨業(yè)合作或者互聯(lián)網(wǎng)巨頭的資源整合。

 03 

算力:力大磚飛?

在19世紀美國西部的淘金熱中,淘金者能真正賺到錢是概率性事件,而賣鏟子的人賺到錢則是必定性結(jié)果。

AI淘金熱中,大模型的戰(zhàn)場局勢還不明朗,玩家尚在前赴后繼,但“賣鏟人”已經(jīng)贏麻了。英偉達靠AI芯片與大模型的潮流拉開了與競爭對手AMD的差距,市值步入“萬億美元俱樂部”。

Open AI CEO薩姆·奧爾特曼提出了新版摩爾定律,即全球AI的運算量每隔18個月就會提升一倍。維持這些運算量需要AI訓(xùn)練芯片支持,而這一領(lǐng)域英偉達的市場份額超過90%。

英偉達的AI芯片產(chǎn)品被全球各大科技企業(yè)瘋狂搶購:2023年3月,微軟宣布已幫助OpenAI建設(shè)了一個新計算中心,配置了數(shù)萬塊A100;5月,Google推出了一個擁有2.6萬塊H100的計算集群ComputeEngineA3。另外,據(jù)國金證券信息,字節(jié)跳動今年已訂購了超過10億美元的GPU,到貨和沒到貨的A100與H800預(yù)計有10萬塊。騰訊發(fā)布的騰訊云新版高性能計算服務(wù)中心也采用了上萬塊H800芯片。

英偉達CFO克雷斯表示,目前AI 算力市場的需求已經(jīng)超出了公司對未來數(shù)個季度的預(yù)期,訂單已經(jīng)多到做不過來了。

當(dāng)然,英偉達賺的錢,我們羨慕也沒用。

國內(nèi)GPU賽道也在迎頭追趕,既有互聯(lián)網(wǎng)巨頭自研AI芯片,如百度AI芯片昆侖、騰訊視頻處理芯片“滄海”和AI芯片“紫霄等,也涌現(xiàn)出燧原科技、天數(shù)智芯、摩爾線程等研發(fā)通用GPU的新興公司。通用GPU用于各種通用任務(wù),包括具有高度的并行計算能力和大規(guī)模的計算核心,是高性能GPU的“下位替代——平行替代”的主要產(chǎn)品,近年來也有大進步,與高性能GPU的差距也在逐步縮小中。

中國工程院院士鄔賀銓建議,在國家科技與產(chǎn)業(yè)計劃的協(xié)調(diào)下合理分工形成算力合力,開放國家實驗室的算力平臺支持各類大模型訓(xùn)練,同時建議組建算力聯(lián)盟,集中已有高檔GPU的算力資源,提供大模型數(shù)據(jù)訓(xùn)練所需算力。

除了高性能GPU之外,成本更低的算力平臺也被認為是新的市場機會。近期九章云極便透露將繼續(xù)與國資云廠商合作,把市場上大量的智算中心納入合作伙伴范疇,向客戶提供集軟硬件于一體的AI模型研發(fā)平臺,客戶的費用將與算力綁定。

算力是發(fā)展大模型的基礎(chǔ),是必要條件而非充分條件,算力所能發(fā)揮的最大作用仍取決于使用方向。只有算法創(chuàng)新與數(shù)據(jù)資源建設(shè)、訓(xùn)練框架迭代齊頭并進,才有創(chuàng)造“力大磚飛”的可能性。

 04 

政策:關(guān)鍵時刻的引導(dǎo)與規(guī)范

推薦閱讀 | 70部人工智能政策解讀:產(chǎn)業(yè)側(cè)重和方向差異

AI大爆炸時期,恰逢我國算法治理與算法備案的關(guān)鍵時刻。

早在2021年,《關(guān)于加強互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見》就把算法備案管理作為監(jiān)管體系完善的重要一環(huán),此后的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》和《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》都明確規(guī)定或提及,“具有輿論屬性或者社會動員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)履行備案手續(xù)”。

2023年4月,國家網(wǎng)信辦起草了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,公開征求意見(注:該辦法已審議通過,自2023年8月15日起施行)。6月,國務(wù)院印發(fā)的《國務(wù)院2023年度立法工作計劃》顯示,人工智能法草案等預(yù)備提請全國人大常委會審議。

《生成式人工智能服務(wù)管理辦法(征求意見稿)》提及,利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會動員能力的互聯(lián)網(wǎng)信息服務(wù)安全評估規(guī)定》向國家網(wǎng)信部門申報安全評估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。

這也是當(dāng)前尚未有大模型產(chǎn)品面向公眾的原因之一。

南開大學(xué)法學(xué)院副院長、中國新一代人工智能發(fā)展戰(zhàn)略研究院特約研究員陳兵教授認為,監(jiān)管前置并不必然會損害技術(shù)創(chuàng)新,但需要注意的是,由于事前審查會在一定程度上增加企業(yè)的合規(guī)成本,若事前審查范圍設(shè)置不當(dāng),可能會抑制生成式AI產(chǎn)品的研發(fā)與訓(xùn)練效能,客觀上會導(dǎo)致生成式AI發(fā)展的降速。

由于人工智能風(fēng)險事前無法極為完善的預(yù)估,事后監(jiān)管又有可能造成巨大損害,故而當(dāng)前我國對人工智能發(fā)展采用全流程監(jiān)管。

在全流程監(jiān)管的規(guī)范下,大模型玩家的合規(guī)成本無疑會增加,備案制又促使著局內(nèi)玩家優(yōu)先謀求備案以將產(chǎn)品早一步推廣至市場,客觀上加速大浪淘沙的速度。法規(guī)的逐步完善伴隨著行業(yè)洗牌、弱者掉隊的過程,也能讓撥云見日的時刻早一點到來。

       原文標(biāo)題 : AI大模型搶灘手機端?新巨頭何時誕生

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號