訂閱
糾錯(cuò)
加入自媒體

大模型狂飆一整年后,2024年應(yīng)關(guān)注哪些關(guān)鍵點(diǎn)?

2023-12-21 18:46
雷科技
關(guān)注

做大模型的企業(yè)那么多,能實(shí)現(xiàn)產(chǎn)業(yè)化的鳳毛麟角。

2023年接近尾聲,AI大模型的熱度絲毫不減。

谷歌剛宣布為開發(fā)人員提供新版Gemini大模型并承諾降低使用成本,微軟就推出了擁有27億參數(shù)的全新語言模型Phi-2。在頭部巨頭動(dòng)作頻頻時(shí),腰部玩家開始抱團(tuán),比如百奧幾何與智譜AI開始共建自然語言-生命語言多模態(tài)大模型。

雖然百度等巨頭早在2019年前后就已布局大模型技術(shù),但2023年確實(shí)算得上是“大模型元年”,幾乎所有頭部科技大廠都深度參與研發(fā),熱錢不斷涌入,將“千模大戰(zhàn)”推向新的高潮。然而,在大模型“軍備競(jìng)賽”之余,業(yè)內(nèi)出現(xiàn)了越來越多的冷思考:基礎(chǔ)大模型越來越多,能實(shí)現(xiàn)產(chǎn)業(yè)化落地為何寥寥無幾?2024年,AI技術(shù)產(chǎn)品化、產(chǎn)業(yè)化以及商業(yè)化,將是大模型發(fā)展的重中之重。

(圖片來自UNsplash)

“千模大戰(zhàn)”高潮迭起,產(chǎn)業(yè)化成頭號(hào)難題

從參與企業(yè)規(guī)模、大模型數(shù)量與市場(chǎng)規(guī)模來看,中國(guó)已是僅次于美國(guó)的全球第二大大模型產(chǎn)業(yè)中心。

作為國(guó)產(chǎn)大模型的“扛旗者”,李彥宏在上個(gè)月的西麗湖論壇上提及一組數(shù)據(jù):截止今年10月國(guó)內(nèi)發(fā)布的大模型多達(dá)238個(gè),較6月翻了整整三倍,Hugging Face平臺(tái)上可供下載的文本生成大模型則接近3萬個(gè)。按比例劃分,美、中兩國(guó)已上線/在研大模型數(shù)量占到全球的80%以上,吊打其他國(guó)家或地區(qū)。

據(jù)速途網(wǎng)測(cè)算,2023年中國(guó)大模型市場(chǎng)規(guī)模約為147億元,同比翻了一倍,預(yù)計(jì)在2028年將突破千億大關(guān)。龐大的市場(chǎng)規(guī)模,巨頭的高度重視,誘惑著資本不斷加大投入;AI對(duì)提升生產(chǎn)效率與經(jīng)濟(jì)質(zhì)量有著重要意義,一定程度關(guān)系到國(guó)家核心競(jìng)爭(zhēng)力,因此也得到了有關(guān)部門高度重視。可以說,大模型狂飆一整年,離不開政策的支持、巨頭的重視和資本的熱情。

在大模型技術(shù)有序發(fā)展上我國(guó)走在世界前列,網(wǎng)信辦等七部委聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》、北京科委發(fā)布的《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025)(征求意見稿)》等中央和地方政府扶持措施相繼出爐,為大模型的發(fā)展掃清障礙,既提供必要資源傾斜,也避免技術(shù)無序發(fā)展。

資本方面,百度、阿里、騰訊、字節(jié)、科大訊飛、美團(tuán)、京東、網(wǎng)易等大廠均在布局大模型技術(shù),有實(shí)力的初創(chuàng)企業(yè)則成了VC們爭(zhēng)搶的香饃饃,熱錢不斷涌入。中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院的報(bào)告顯示,截止10月底,國(guó)內(nèi)已有38起大模型投融資事件,現(xiàn)存AI企業(yè)已超過2200家。

(圖片來自貝殼財(cái)經(jīng))

而在技術(shù)層面,文心大模型、阿里通義、訊飛星火、智譜等國(guó)產(chǎn)基礎(chǔ)大模型在多個(gè)榜單上的評(píng)測(cè)均位居前列,一定程度上已能與GPT PK。

大模型行業(yè)欣欣向榮,但依然存在一些隱憂——比如困擾大部分從業(yè)者的產(chǎn)業(yè)化落地問題。任何前沿技術(shù)都要轉(zhuǎn)化為產(chǎn)品或者說應(yīng)用才能為人所用,才能發(fā)揮價(jià)值。AI大模型當(dāng)前在基礎(chǔ)技術(shù)迎頭直追的同時(shí),更需要深入到產(chǎn)業(yè)端的場(chǎng)景中,在企業(yè)的生產(chǎn)經(jīng)營(yíng)中,或者用戶的生活學(xué)習(xí)中發(fā)揮作用。事實(shí)上,后者正是中國(guó)AI產(chǎn)業(yè)一直以來的優(yōu)勢(shì):相較于下棋、畫畫、作詩而言,中國(guó)科技從業(yè)者更接地氣,善于將技術(shù)應(yīng)用到場(chǎng)景中,讓其為產(chǎn)品、應(yīng)用或者服務(wù)所用——哪怕沒那么炫酷也不重要。

三個(gè)標(biāo)桿案例,看大模型產(chǎn)業(yè)化落地之路

大模型產(chǎn)業(yè)化的難點(diǎn)很多,比如不同行業(yè)數(shù)字化程度參差不齊,不同規(guī)模、不同領(lǐng)域的企業(yè)對(duì)AI的應(yīng)用需求、可承擔(dān)的成本,有顯著差別,這里的成本除了資金等經(jīng)濟(jì)成本外,還有應(yīng)用AI技術(shù)改造業(yè)務(wù)的風(fēng)險(xiǎn)、時(shí)間與邊際成本。正因?yàn)榇耍?dāng)前雖然很多企業(yè)都在關(guān)注大模型技術(shù),但真正做到用大模型技術(shù)來改造業(yè)務(wù)甚至打造AI原生應(yīng)用的企業(yè),卻少之又少。

不過浪里淘沙,我們也能看到一些大模型技術(shù)和產(chǎn)業(yè)結(jié)合的標(biāo)桿案例。

1、度小滿軒轅大模型:國(guó)內(nèi)首個(gè)開源金融大模型

數(shù)據(jù)驅(qū)動(dòng)的金融業(yè)是數(shù)字化程度較高的產(chǎn)業(yè),數(shù)據(jù)庫、存儲(chǔ)、服務(wù)器、自動(dòng)化、信息安全等等數(shù)字化基礎(chǔ)設(shè)施,均是在金融業(yè)率先應(yīng)用普及。在AI技術(shù)普及過程中,金融業(yè)很早就在積極探索將AI與客服、風(fēng)控、授信、營(yíng)銷等場(chǎng)景結(jié)合,降本增效的同時(shí),提升客戶體驗(yàn)。

2023年,大模型技術(shù)爆發(fā)。金融科技先鋒平臺(tái)度小滿在5月就率先開源了國(guó)內(nèi)首個(gè)千億級(jí)中文金融大模型“軒轅”;9月,“軒轅70B”開源開放可被自由下載和使用。作為金融場(chǎng)景而生的行業(yè)大模型,軒轅在智能化能力、功能服務(wù)以及信息安全上均有很強(qiáng)的針對(duì)性。

這種針對(duì)性體現(xiàn)在多個(gè)方面:比如軒轅用來訓(xùn)練的數(shù)據(jù)集包含大量機(jī)構(gòu)研報(bào)、專業(yè)名詞、行情數(shù)據(jù)等金融行業(yè)資料,賦予了其極強(qiáng)的金融信息理解和處理能力。

在技術(shù)實(shí)力上,軒轅大模型不遑多讓。其已通過注冊(cè)會(huì)計(jì)師考試、銀行/證券/保險(xiǎn)/基金/期貨從業(yè)資格、理財(cái)規(guī)劃師、經(jīng)濟(jì)師等金融領(lǐng)域權(quán)威考試。而在清華大學(xué)、上海交大和愛丁堡大學(xué)聯(lián)合發(fā)布的C-Eval大語言模型測(cè)評(píng)榜單和微軟亞洲研究院、MBZUAI、上海交大聯(lián)合推出的CMMLU榜單中,軒轅均取得了國(guó)內(nèi)所有開源模型排名第一的成績(jī)。C-Eval和CMMLU是目前較為權(quán)威的兩大專業(yè)榜單,能夠同時(shí)奪得第一,對(duì)軒轅這樣的行業(yè)大模型來說絕對(duì)算得上好成績(jī)了。

度小滿軒轅大模型正在金融場(chǎng)景深入應(yīng)用。

在內(nèi)部,軒轅大模型已深入賦能度小滿營(yíng)銷、客服、風(fēng)控、辦公再到研發(fā)等場(chǎng)景,并已初見成效。在代碼助手方面,用大模型輔助生成的代碼,采納率能夠達(dá)到42%,幫助公司整體研發(fā)效率提升了20%;在客服領(lǐng)域,大模型推動(dòng)服務(wù)效率提升了25%。在智能辦公領(lǐng)域,大模型目前的意圖識(shí)別準(zhǔn)確率已達(dá)到97%。

度小滿向來都很重視金融科技能力對(duì)外輸出。度小滿CTO許冬亮透露,軒轅在5月開源時(shí)就有上百家金融機(jī)構(gòu)發(fā)出試用申請(qǐng)。從企業(yè)客戶的反饋來看,軒轅大模型的專業(yè)能力有口皆碑,2.0版本上下文對(duì)話長(zhǎng)度增加至8K,對(duì)“非利息收入增長(zhǎng)趨勢(shì)”等金融業(yè)的深度問題也能給出專業(yè)解釋。

2、阿里通義千問大模型,在電商行業(yè)貫徹“AI驅(qū)動(dòng)”戰(zhàn)略。

2023年阿里巴巴有許多大的變動(dòng),“用戶為先、AI驅(qū)動(dòng)”成為新的戰(zhàn)略方向。4月11日發(fā)布通義千問大模型的時(shí)候,時(shí)任阿里巴巴集團(tuán)董事長(zhǎng)、阿里云智能集團(tuán)CEO張勇就表示“所有軟件都值得用大模型升級(jí)改造,阿里所有產(chǎn)品都會(huì)接入通義千問。”

阿里確實(shí)說到做到,作為阿里大本營(yíng)的電商業(yè)務(wù)就早已全面AI化。以通義千問大模型為基礎(chǔ),淘天集團(tuán)推出了一系列面向B、C兩端的AI工具。

面向B端的工具包括官方客服機(jī)器人、圖片智能生成、營(yíng)銷投放自主監(jiān)測(cè)等,今年雙11大促期間商家調(diào)用后臺(tái)AI工具的次數(shù)超過15億次;面向C端則推出AI智能助手淘寶問問,上線兩個(gè)月受邀試用人數(shù)突破500萬。B端工具可提高商家經(jīng)營(yíng)效率、降低流量成本,C端功能則可顯著改善用戶體驗(yàn),在電商行業(yè)狂卷價(jià)格時(shí)形成差異化競(jìng)爭(zhēng)力。

大模型與電商場(chǎng)景的結(jié)合,阿里走得最快也最遠(yuǎn),馬云在阿里內(nèi)網(wǎng)回帖中甚至提到了“AI電商”這一讓人耳目一新的概念。

為了進(jìn)一步強(qiáng)化大模型技術(shù)實(shí)力,以及深化AI與業(yè)務(wù)的融合,近日淘天集團(tuán)被爆暗中組建新的AI團(tuán)隊(duì),高調(diào)高薪招聘AI頂尖人才,抓緊時(shí)間訓(xùn)練針對(duì)電商產(chǎn)業(yè)的專屬大模型“圖靈”。根據(jù)淘天集團(tuán)此前透露的消息,未來一年會(huì)向商家發(fā)布更多AI工具,包括AI開店、經(jīng)營(yíng)咨詢、智能周報(bào)等,服務(wù)范圍涉及商家日常經(jīng)營(yíng)的方方面面。在阿里的推動(dòng)下,大模型和電商產(chǎn)業(yè)的結(jié)合才剛剛開始。可以預(yù)見,2024年,頭部電商平臺(tái)均會(huì)加碼“大模型電商”。

3、科大訊飛星火大模型:大模型+教育的標(biāo)桿玩家。

科大訊飛的第一標(biāo)簽是語音智能,第二標(biāo)簽就是智能教育科技巨頭。在大模型技術(shù)出現(xiàn)前,科大訊飛在AI技術(shù)上就已耕耘多年,其相當(dāng)一部分營(yíng)收就來自智能教育服務(wù),如口語評(píng)測(cè)、教育硬件等教育智能化服務(wù)。

在大模型技術(shù)爆發(fā)后,星火大模型和教育行業(yè)的結(jié)合更是轟轟烈烈。今年5月訊飛星火認(rèn)知大模型1.0版本發(fā)布次日,帶飛了A股教育科技板塊,除了科大訊飛外,學(xué)大教育、行動(dòng)教育、國(guó)新文化全跟著漲停,呈現(xiàn)出“星火燎原”之勢(shì)。

從1.0到3.0,訊飛星火大模型一直重點(diǎn)攻克代碼能力和多模態(tài)能力,并基于技術(shù)上的突破開發(fā)出更多針對(duì)學(xué)校、教育企業(yè)以及教師和學(xué)生群體的功能、應(yīng)用。比如針對(duì)學(xué)校管理環(huán)節(jié)的學(xué)生及教師信息管理、離校申請(qǐng)審核功能,為教師量身打造的教學(xué)課件制作助手,給學(xué)生提供的AI一對(duì)一啟發(fā)式對(duì)話功能等。與此同時(shí),訊飛在其翻譯筆、錄音筆、學(xué)習(xí)機(jī)、辦公本等教育硬件上也在深入應(yīng)用大模型技術(shù),強(qiáng)化產(chǎn)品力,鞏固在這一品類上的優(yōu)勢(shì)。

(圖片來自訊飛星火官網(wǎng))

金融、電商與教育,三個(gè)行業(yè)的頭部玩家,均能在大模型的改造下獲得全新增長(zhǎng)點(diǎn),可見大模型產(chǎn)業(yè)化并非癡人說夢(mèng),而是必然趨勢(shì)。

大模型開卷2024:有無產(chǎn)業(yè)化秘訣?

度小滿、阿里、科大訊飛們只是開了個(gè)好頭,大模型產(chǎn)業(yè)化程度依然有很大提升空間,特別是歷史悠久、數(shù)字化程度較低的農(nóng)業(yè)、制造業(yè)、物流航運(yùn)業(yè)、能源業(yè)等產(chǎn)業(yè),更是亟需擁抱大模型技術(shù)提高生產(chǎn)效率,實(shí)現(xiàn)從數(shù)字化到智能化的跨越。鑒于此,加速AI技術(shù)產(chǎn)品化、產(chǎn)業(yè)化和商業(yè)化將是大模型行業(yè)在2024年的頭號(hào)任務(wù)。誰能率先跑通產(chǎn)業(yè)化落地路徑,誰就可以在“千模大戰(zhàn)”中笑到最后。那么,標(biāo)桿玩家們給大模型產(chǎn)業(yè)化帶來了什么啟示呢?

第一,不重復(fù)發(fā)明輪子,有針對(duì)性地選擇訓(xùn)練參數(shù)和設(shè)計(jì)功能服務(wù)。

基礎(chǔ)大模型已經(jīng)很多了,市面上缺的是能跟抗衡甚至超越GPT的頂尖基礎(chǔ)大模型,以及可讓千行百業(yè)更低成本、更低門檻、更快應(yīng)用的“產(chǎn)業(yè)大模型”。而要做出強(qiáng)大的產(chǎn)業(yè)大模型,需要“既懂AI技術(shù)又是產(chǎn)業(yè)專家”。

度小滿就是一個(gè)很好的例子,一邊有背靠百度的AI技術(shù)底子,另一邊有深耕金融科技行業(yè)多年積攢下的產(chǎn)業(yè)認(rèn)知、能力、場(chǎng)景、生態(tài)等資源。

據(jù)悉,軒轅雖是基于擁有1760億參數(shù)的Bloom大模型訓(xùn)練而成,但也離不開度小滿這些年積累的千億tokens中文預(yù)訓(xùn)練數(shù)據(jù)集,包括銀行、保險(xiǎn)、基金等行業(yè)的基礎(chǔ)知識(shí)與巨量參數(shù)。因?yàn)橛泻笳,軒轅大模型才有遠(yuǎn)超同類競(jìng)品和通用大模型的金融信息處理能力,也才可以面向金融業(yè)的痛點(diǎn)場(chǎng)景提供針對(duì)性的功能服務(wù)。

第二,深入貼合行業(yè)需求“定制”大模型功能服務(wù),而不是閉門造車。

技術(shù)類公司容易出現(xiàn)“拿著錘子找釘子”的問題,如果不能貼合真實(shí)需求,技術(shù)再?gòu)?qiáng)大都可能只是自嗨。

為什么度小滿、阿里和科大訊飛可以在大模型產(chǎn)業(yè)化上先嘗到甜頭?因?yàn)榘⒗锉旧砭褪请娚坍a(chǎn)業(yè)的龍頭,度小滿從成立之日起一直深度參與國(guó)內(nèi)科技金融行業(yè)建設(shè),科大訊飛也深耕智能教育行業(yè)十?dāng)?shù)載,它們對(duì)相應(yīng)行業(yè)理解非一般企業(yè)所能及。讀懂行業(yè)運(yùn)作邏輯和深層次問題,就能洞悉企業(yè)、從業(yè)者的真正痛點(diǎn),并給出行之有效的解決方案。

以度小滿為例,基于的理解、生成、邏輯和記憶四個(gè)基礎(chǔ)能力,軒轅大模型融合金融行業(yè)的使用習(xí)慣、優(yōu)化需求,提供了一系列針對(duì)性功能。比如個(gè)人信貸管理服務(wù),軒轅大模型為銀行客戶提供客戶歷史信息管理、用戶多層次需求分析功能,給用戶提供專業(yè)問題自然語言交互問答服務(wù),充分提高雙方的處理效率。度小滿在服務(wù)金融機(jī)構(gòu)和自有客戶時(shí)洞察了許多需求,才可以做出真正能用、有用、好用的金融大模型產(chǎn)品。

第三,眾人抬柴火焰高,大模型不是獨(dú)角戲,必須惠及行業(yè)參與者。

中小企業(yè)是產(chǎn)業(yè)鏈的主力軍,然而因?yàn)槭芟抻谫Y金實(shí)力與人才資源,往往很難再第一時(shí)間應(yīng)用新技術(shù),特別是門檻很高的新技術(shù)。相較于深度學(xué)習(xí)而言,大模型需要巨量算力、巨量數(shù)據(jù)和巨量算法,門檻高出了許多,對(duì)很多企業(yè)來說有些可望不可即。這對(duì)頭部玩家來說是機(jī)遇所在,如果堅(jiān)持普惠開放路線,既可讓大模型技術(shù)有“產(chǎn)業(yè)化”的落點(diǎn),也可以在大模型產(chǎn)業(yè)化中獲取對(duì)應(yīng)價(jià)值。

在度小滿和北大光華管理學(xué)院聯(lián)合舉辦的大模型技術(shù)與應(yīng)用論壇上,度小滿CTO許冬亮就發(fā)表過類似觀點(diǎn),他認(rèn)為大模型是中小金融機(jī)構(gòu)突圍而出的機(jī)會(huì),因?yàn)樗鼈兛赏ㄟ^應(yīng)用創(chuàng)新加快數(shù)字化、智能化升級(jí)進(jìn)程,繼而跨越數(shù)字化鴻溝。

也不難發(fā)現(xiàn),“開放”成了成功落地產(chǎn)業(yè)的大模型的最大公約數(shù)。度小滿的軒轅、阿里的通義千問、科大訊飛的星火走的均是開源開放路線。正如許冬亮所言,將大模型能力開放給金融機(jī)構(gòu),不僅可以加快技術(shù)的推廣普及,還能降低使用門檻,是實(shí)現(xiàn)技術(shù)普惠的必然選擇。

跟區(qū)塊鏈等新興技術(shù)的曇花一現(xiàn)不同,大模型的熱度不會(huì)驟然下降。一方面,大模型技術(shù)在2024年將會(huì)縱深到更多產(chǎn)業(yè),C端,大模型驅(qū)動(dòng)的爆款現(xiàn)象級(jí)應(yīng)用一定會(huì)出現(xiàn),B端,大模型產(chǎn)業(yè)化的案例只會(huì)越來越多。另一方面,大模型技術(shù)本質(zhì)是深度學(xué)習(xí)技術(shù)的延續(xù)。AI技術(shù)已發(fā)展10余年,未來幾十年都將是科技產(chǎn)業(yè)的基礎(chǔ)技術(shù)。大模型是AI浪潮上最大的一朵浪花,而AI浪潮,將持續(xù)澎湃。

    來源:雷科技

           原文標(biāo)題 : 大模型狂飆一整年后,2024年應(yīng)關(guān)注哪些關(guān)鍵點(diǎn)?

    聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

    發(fā)表評(píng)論

    0條評(píng)論,0人參與

    請(qǐng)輸入評(píng)論內(nèi)容...

    請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

    您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

    • 看不清,點(diǎn)擊換一張  刷新

    暫無評(píng)論

    暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)