中文字幕第1页中文字幕在,国产精品久线观看视频

AI大模型搶灘手機端？新巨頭何時誕生

2023-08-16 10:17

導(dǎo)言

8月14日，雷軍宣布小米科技戰(zhàn)略升級，并公布了升級后的科技理念：選擇對人類文明有長期價值的技術(shù)領(lǐng)域，堅持長期持續(xù)投入。

“深耕底層技術(shù)，長期持續(xù)投入，軟硬深度融合，AI全面賦能”，這是小米科技戰(zhàn)略升級的四個關(guān)鍵路徑與原則。雷軍表示，軟件硬件深度融合，是為用戶提供獨特體驗的根本保證，而AI則是未來的生產(chǎn)力，也是小米長期持續(xù)投入的底層賽道之一。

自2016年組建AI團隊至今，小米人工智能團隊人員規(guī)模已達3000多人。今年4月小米組建了AI大模型團隊，8月14日晚，雷軍正式宣布了小米的大模型戰(zhàn)略：全面擁抱大模型。據(jù)悉，小米旗下的智能語音助手小愛同學(xué)將接入大模型能力，并于14日開啟邀請內(nèi)測。

雷軍稱，小米大模型技術(shù)的重點突破方向為“輕量化、本地部署”，小米考慮的是優(yōu)先在手機上實現(xiàn)端側(cè)跑通，讓每個人都能更好在手機上使用大模型。

面對新一輪產(chǎn)業(yè)與技術(shù)變革帶來的時代巨變，大巨頭公司也好、小巨人企業(yè)也罷，都紛紛入局大模型賽道。當(dāng)前“百模大戰(zhàn)”進展到什么階段，本文可以為您提供參考。

來源 | 零壹智庫

2023年以來，科技圈最熱的詞語就是ChatGPT及其背后的大模型技術(shù)。

此前有百度文心一言、阿里云通義千問、華為盤古、科大訊飛星火等，近期李開復(fù)入局建立零一萬物、火山引擎推出“火山方舟”。短短數(shù)月，各類企業(yè)研發(fā)和發(fā)布大模型應(yīng)用已成潮流。

國內(nèi)10億級參數(shù)規(guī)模以上大模型已超80個，并且還在快速增加。一場圍繞大模型的商業(yè)戰(zhàn)爭的備戰(zhàn)氛圍已經(jīng)極為濃厚。

大巨頭公司也好，小巨人企業(yè)也罷，都需要這樣的動作展現(xiàn)自身對前沿科技的敏感度與長期以來的積累。早一步推出應(yīng)用，便可早一日測試大模型與用戶交互上的寶貴數(shù)據(jù)，在未來競爭中“廣積糧，圖稱王”。

大模型的關(guān)鍵的還是AI領(lǐng)域要素——算法、算力、數(shù)據(jù)，以及場景/應(yīng)用。算法代表策略，算力決定上限也設(shè)置了門檻，數(shù)據(jù)等同軍糧也象征著優(yōu)劣之分。三要素之外，場景/應(yīng)用代表出兵方向。

“百模大戰(zhàn)”爆發(fā)，要素齊備的巨頭公司是否會演變成技術(shù)能力的無限內(nèi)卷？垂直賽道的小巨頭能否借助大模型夯實自己的領(lǐng)先地位？在獲得門票的新玩家中，誰有可能是行業(yè)統(tǒng)治地位的有力競爭者？

通用大模型“實力分水嶺”未現(xiàn)

大模型的玩家主要分為三類：一是在資源與場景上具備身位優(yōu)勢的互聯(lián)網(wǎng)（百度、阿里、騰訊等）和產(chǎn)業(yè)巨頭（中國電信與中國聯(lián)通等），二是專研AI的人工智能公司（商湯、云從、光年之外等），最后一類則是以上海人工智能實驗室、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)等為代表的科研院所單位。

根據(jù)公開數(shù)據(jù)，截至2023年7月初，我國10億級參數(shù)規(guī)模以上大模型已超80個，且還在快速增加。該參數(shù)量的大模型越多，標(biāo)志著競爭門檻將逐步拔高。

目前已經(jīng)發(fā)布的大模型絕大多數(shù)屬于通用大模型，原因主要有兩種：一是大模型競爭尚不明朗，純粹技術(shù)層面并未拉開代差，行業(yè)參與者都有機會稱霸江湖；二是面向公眾的應(yīng)用型大模型仍未出現(xiàn)，缺乏較為明確的方向指引，在國內(nèi)大模型的“Chat GPT時刻”出現(xiàn)前，投身通用大模型是既主動又被動的無奈之選。

何況，大模型領(lǐng)域極有可能走出一個新巨頭。

周鴻祎認為，大模型必須“通用”，只有通用才能走進千家萬戶、賦能百行千業(yè)，進而主導(dǎo)人工智能新革命。

話中未盡之處是，需要多少投入和配合才能成為引領(lǐng)新革命的主導(dǎo)者。不管大模型是藍海還是紅海市場，必然要存在大魚領(lǐng)銜、小魚配合的生態(tài)結(jié)構(gòu)，而目前大魚和小魚之間的實力分水嶺仍未出現(xiàn)。

以當(dāng)前局勢看，10億參數(shù)規(guī)模的大模型可以視為入局門檻，100億參數(shù)規(guī)模的大模型可認為具備逐鹿天下的能力，但即使是1000億參數(shù)規(guī)模的大模型也遠未達到一騎絕塵的領(lǐng)先水平。

參數(shù)量并非決定戰(zhàn)場局勢的壓倒性力量，資源調(diào)度能力、長期經(jīng)驗積累、大額科研投入等因素都是大模型競爭中長期存在的核心差異點。

要對標(biāo)Open AI，需要看清Chat GPT爆發(fā)背后是微軟在數(shù)據(jù)、算力、海量資金上的全面支持，才有了之后的厚積薄發(fā)。

大模型是長期投入的行業(yè)，簡單來說就是“燒錢”。算力、算法與數(shù)據(jù)的積累非一夕之功，模型發(fā)布之后還需要反復(fù)訓(xùn)練、敏捷迭代，最終不斷演變?yōu)?ldquo;成熟體”。

放到現(xiàn)實環(huán)境下，大模型的玩家是技術(shù)驅(qū)動還是利益驅(qū)動？Open AI是當(dāng)下全球最知名的大模型公司，即便手握Chat GPT這一爆款產(chǎn)品，其商業(yè)化能力仍然堪憂。作為一家逼近300億美元市值的科技企業(yè)，2023年身處AI浪潮中心，Open AI至今收入仍不過2億美元。

初期投入只是起始花費，之后每一次訓(xùn)練都需要真金白銀往里砸，有多少公司能否接受大模型競爭中那少得可憐的投資回報率？Chat GPT的成功，證明了大模型在產(chǎn)品路徑上的打通，但并不意味著商業(yè)層面的巨大成功。

至少在投入產(chǎn)出比層面，互聯(lián)網(wǎng)巨頭相對優(yōu)勢更大，他們有足夠的動力和資源去支撐前期的戰(zhàn)略性虧損，一如當(dāng)年的阿里云。

至于到底燒錢要燒多久，何時才能看到喜人的投資回報，大公司不知道，創(chuàng)業(yè)公司的VC也不知道。這是一場隨時可能離場的豪賭，而籌碼動輒數(shù)十億美金。

對于“人有我優(yōu)”的大模型玩家而言，優(yōu)先探索應(yīng)用層，及早開放測試，誰能積累更為珍貴的交互數(shù)據(jù)，將是接下來競爭的破局點。

垂直之需與垂直之困

通用大模型的角逐，更多是基礎(chǔ)設(shè)施制定權(quán)的爭奪，而垂直大模型，則是在特定場景中依托開源大模型或API接口，在細分行業(yè)形成差異化競爭能力，更多聚焦在場景應(yīng)用。

在通用大模型的戰(zhàn)場上，隨著時間推進，一些力有不逮的玩家會逐步掉隊，最終只會存在寥寥數(shù)個通用大模型，起到基礎(chǔ)設(shè)施的作用。同時，這些大模型還面臨著同質(zhì)化問題，應(yīng)用層仍然要靠垂直大模型發(fā)力。

通用大模型像是多個垂直大模型的集合，訓(xùn)練場景越多，通用大模型的“通用性”越強。

作為國內(nèi)最早發(fā)布類Chat GPT產(chǎn)品的公司，百度對大模型垂直應(yīng)用層的需求十分緊迫。李彥宏表示：“比大模型數(shù)量更重要的是應(yīng)用，是在垂直領(lǐng)域應(yīng)用的突破。新的國際競爭戰(zhàn)略關(guān)鍵點，不是有多少個大模型，而是大模型上有多少原生的應(yīng)用，這些應(yīng)用在多大程度上提升了生產(chǎn)效率。”

按照李彥宏的比喻，大模型尤其是通用大模型就像是AI時代的操作系統(tǒng)，所有的應(yīng)用都將圍繞著大模型開發(fā)，其上是應(yīng)用層，包括各種各樣的AI原生應(yīng)用。

歸根結(jié)底，所謂的“通用”只是一個相對概念，并不存在完全適用于所有領(lǐng)域、具備足夠行業(yè)深度的通用大模型。以Chat GPT為例，真正得以廣泛應(yīng)用的仍是一些容錯率較高的行業(yè)，即便大模型給出的解決方案出錯，錯誤也局限在較為有限的范圍內(nèi)。而在重工業(yè)、航天、醫(yī)療等場景中，一次錯誤所造成的損失不可估量，即Chat GPT不能滿足特定場景的垂直性、專業(yè)性要求。

要兼顧垂直性與專業(yè)性要求，數(shù)據(jù)是硬傷，數(shù)據(jù)深度足夠且能形成穩(wěn)定護城河的行業(yè)更少。這些行業(yè)的數(shù)據(jù)是否便于獲得，已經(jīng)獲得的數(shù)據(jù)能否滿足特定行業(yè)日新月異的要求，都很難具體評定。

互聯(lián)網(wǎng)巨頭擁有大量電商、社交、搜索等網(wǎng)絡(luò)數(shù)據(jù)，但數(shù)據(jù)類型不夠全面，數(shù)據(jù)質(zhì)量也沒有保障，中文可供訓(xùn)練的語料還需要做大量的挖掘工作。

近期在政務(wù)、公共安全、醫(yī)療等領(lǐng)域，垂直大模型正在陸續(xù)落地。例如，云知聲在智慧醫(yī)療領(lǐng)域自研“山海”大模型，結(jié)合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術(shù)，預(yù)計可提升醫(yī)生的電子病歷錄入效率超過400%，節(jié)約單個患者問診時間超過40%，提升醫(yī)生門診效率超過66%。

拓爾思基于自有的公文、政策文件、政務(wù)辦事指南等數(shù)據(jù)作為專業(yè)訓(xùn)練數(shù)據(jù)，打造了政務(wù)專業(yè)大模型。

金融領(lǐng)域內(nèi)，恒生電子2023年3月底開始籌劃、設(shè)計金融大模型產(chǎn)品。6月末，恒生電子和旗下子公司恒生聚源發(fā)布基于大語言模型技術(shù)打造的數(shù)智金融新品——金融智能助手光子和全新升級的智能投研平臺WarrenQ，恒生電子金融行業(yè)大模型LightGPT也首次對外亮相。

騰訊這種具備多個行業(yè)資源的互聯(lián)網(wǎng)巨頭則是多面下注。在6月下旬，騰訊公布的MaaS服務(wù)解決方案覆蓋了金融、文旅、政務(wù)、教育等10個行業(yè)，共有超50個解決方案。

同時，垂直大模型所需要的數(shù)據(jù)往往并不局限在本行業(yè)，某些業(yè)務(wù)也許需要另一個或多個行業(yè)的數(shù)據(jù)整合，其模型訓(xùn)練和應(yīng)用就依賴于企業(yè)的跨業(yè)合作或者互聯(lián)網(wǎng)巨頭的資源整合。

算力：力大磚飛？

在19世紀美國西部的淘金熱中，淘金者能真正賺到錢是概率性事件，而賣鏟子的人賺到錢則是必定性結(jié)果。

AI淘金熱中，大模型的戰(zhàn)場局勢還不明朗，玩家尚在前赴后繼，但“賣鏟人”已經(jīng)贏麻了。英偉達靠AI芯片與大模型的潮流拉開了與競爭對手AMD的差距，市值步入“萬億美元俱樂部”。

Open AI CEO薩姆·奧爾特曼提出了新版摩爾定律，即全球AI的運算量每隔18個月就會提升一倍。維持這些運算量需要AI訓(xùn)練芯片支持，而這一領(lǐng)域英偉達的市場份額超過90%。

英偉達的AI芯片產(chǎn)品被全球各大科技企業(yè)瘋狂搶購：2023年3月，微軟宣布已幫助OpenAI建設(shè)了一個新計算中心，配置了數(shù)萬塊A100；5月，Google推出了一個擁有2.6萬塊H100的計算集群ComputeEngineA3。另外，據(jù)國金證券信息，字節(jié)跳動今年已訂購了超過10億美元的GPU，到貨和沒到貨的A100與H800預(yù)計有10萬塊。騰訊發(fā)布的騰訊云新版高性能計算服務(wù)中心也采用了上萬塊H800芯片。

英偉達CFO克雷斯表示，目前AI 算力市場的需求已經(jīng)超出了公司對未來數(shù)個季度的預(yù)期，訂單已經(jīng)多到做不過來了。

當(dāng)然，英偉達賺的錢，我們羨慕也沒用。

國內(nèi)GPU賽道也在迎頭追趕，既有互聯(lián)網(wǎng)巨頭自研AI芯片，如百度AI芯片昆侖、騰訊視頻處理芯片“滄海”和AI芯片“紫霄等，也涌現(xiàn)出燧原科技、天數(shù)智芯、摩爾線程等研發(fā)通用GPU的新興公司。通用GPU用于各種通用任務(wù)，包括具有高度的并行計算能力和大規(guī)模的計算核心，是高性能GPU的“下位替代——平行替代”的主要產(chǎn)品，近年來也有大進步，與高性能GPU的差距也在逐步縮小中。

中國工程院院士鄔賀銓建議，在國家科技與產(chǎn)業(yè)計劃的協(xié)調(diào)下合理分工形成算力合力，開放國家實驗室的算力平臺支持各類大模型訓(xùn)練，同時建議組建算力聯(lián)盟，集中已有高檔GPU的算力資源，提供大模型數(shù)據(jù)訓(xùn)練所需算力。

除了高性能GPU之外，成本更低的算力平臺也被認為是新的市場機會。近期九章云極便透露將繼續(xù)與國資云廠商合作，把市場上大量的智算中心納入合作伙伴范疇，向客戶提供集軟硬件于一體的AI模型研發(fā)平臺，客戶的費用將與算力綁定。

算力是發(fā)展大模型的基礎(chǔ)，是必要條件而非充分條件，算力所能發(fā)揮的最大作用仍取決于使用方向。只有算法創(chuàng)新與數(shù)據(jù)資源建設(shè)、訓(xùn)練框架迭代齊頭并進，才有創(chuàng)造“力大磚飛”的可能性。

政策：關(guān)鍵時刻的引導(dǎo)與規(guī)范

推薦閱讀 | 70部人工智能政策解讀：產(chǎn)業(yè)側(cè)重和方向差異

AI大爆炸時期，恰逢我國算法治理與算法備案的關(guān)鍵時刻。

早在2021年，《關(guān)于加強互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見》就把算法備案管理作為監(jiān)管體系完善的重要一環(huán)，此后的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》和《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》都明確規(guī)定或提及，“具有輿論屬性或者社會動員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)履行備案手續(xù)”。

2023年4月，國家網(wǎng)信辦起草了《生成式人工智能服務(wù)管理辦法（征求意見稿）》，公開征求意見（注：該辦法已審議通過，自2023年8月15日起施行）。6月，國務(wù)院印發(fā)的《國務(wù)院2023年度立法工作計劃》顯示，人工智能法草案等預(yù)備提請全國人大常委會審議。

《生成式人工智能服務(wù)管理辦法（征求意見稿）》提及，利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前，應(yīng)當(dāng)按照《具有輿論屬性或社會動員能力的互聯(lián)網(wǎng)信息服務(wù)安全評估規(guī)定》向國家網(wǎng)信部門申報安全評估，并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。

這也是當(dāng)前尚未有大模型產(chǎn)品面向公眾的原因之一。

南開大學(xué)法學(xué)院副院長、中國新一代人工智能發(fā)展戰(zhàn)略研究院特約研究員陳兵教授認為，監(jiān)管前置并不必然會損害技術(shù)創(chuàng)新，但需要注意的是，由于事前審查會在一定程度上增加企業(yè)的合規(guī)成本，若事前審查范圍設(shè)置不當(dāng)，可能會抑制生成式AI產(chǎn)品的研發(fā)與訓(xùn)練效能，客觀上會導(dǎo)致生成式AI發(fā)展的降速。

由于人工智能風(fēng)險事前無法極為完善的預(yù)估，事后監(jiān)管又有可能造成巨大損害，故而當(dāng)前我國對人工智能發(fā)展采用全流程監(jiān)管。

在全流程監(jiān)管的規(guī)范下，大模型玩家的合規(guī)成本無疑會增加，備案制又促使著局內(nèi)玩家優(yōu)先謀求備案以將產(chǎn)品早一步推廣至市場，客觀上加速大浪淘沙的速度。法規(guī)的逐步完善伴隨著行業(yè)洗牌、弱者掉隊的過程，也能讓撥云見日的時刻早一點到來。

原文標(biāo)題 : AI大模型搶灘手機端？新巨頭何時誕生