訂閱
糾錯(cuò)
加入自媒體

個(gè)性化大模型,將大開眼界

撰文|吳坤諺  

編輯|王潘

先有理論還是先有應(yīng)用?

起碼在涌現(xiàn)能力上,是應(yīng)用為先。例如大語(yǔ)言模型(LLMs)的涌現(xiàn)能力(emergent ability),以GPT3為代表的主流大語(yǔ)言模型在參數(shù)規(guī)模超過(guò)10^22級(jí)別后,效果突然大幅提升。

這讓大模型的研發(fā)在短短數(shù)月內(nèi)進(jìn)入了一場(chǎng)取決于數(shù)據(jù)獲取和算力調(diào)配的競(jìng)賽,“技術(shù)上有深度但競(jìng)爭(zhēng)呈紅海”。但就在業(yè)內(nèi)相互比拼參數(shù)多少的時(shí)候,天貓精靈在嘗試用億級(jí)參數(shù)做AIGC。

4月,天貓精靈公開了首個(gè)接入千問(wèn)大模型的智能硬件demo,近日又透出了一款研發(fā)中的AIGC新型硬件demo——智能隨身眼鏡。目前市場(chǎng)公版暫不清楚升級(jí)政策,但從工程體驗(yàn)來(lái)看,具有隨身聊天+語(yǔ)音生成的功能。

據(jù)了解,該款智能隨身眼鏡的載體是天貓商城中在售的CZ0001,原先的設(shè)備已經(jīng)搭載了骨傳導(dǎo)結(jié)構(gòu)為基礎(chǔ)的通話、音頻、防水等功能。在實(shí)機(jī)體驗(yàn)中,demo通過(guò)原搭載在智能眼鏡中的收發(fā)聲單元與測(cè)評(píng)人流暢交互,形式上也并非一般大模型中展現(xiàn)的一問(wèn)一答,而是更偏向于溝通的人性化交互。此外,該demo在接收人聲信號(hào)后的反應(yīng)速度較快,在健康、辦公以及游戲等多樣化的消費(fèi)場(chǎng)景中都展現(xiàn)出了不錯(cuò)的反應(yīng)速度,并未出現(xiàn)卡殼的現(xiàn)象。

智能硬件和軟件一樣,存在與大模型相結(jié)合的無(wú)數(shù)可能,是大模型的又一個(gè)具備豐富的落地應(yīng)用場(chǎng)景的方向。小度開始做手機(jī),天貓精靈做眼鏡,背后是對(duì)智能終端發(fā)展不同的思路。天貓精靈demo的問(wèn)世,也意味著大模型進(jìn)入了軟件應(yīng)用之外的場(chǎng)景,這無(wú)疑標(biāo)志著AIGC硬件會(huì)逐漸走入更加個(gè)人化的、隨身的垂直使用場(chǎng)景中。

大模型不應(yīng)厚B薄C

大模型領(lǐng)域,我們還在朝著OpenAI緊追慢趕,只是在商業(yè)化領(lǐng)域,國(guó)內(nèi)玩家的步伐明顯更快。在今年4月到5月間的大模型井噴期,一眾入局者在公布了自家大模型的同時(shí)也給出了商業(yè)化落地的路徑。

就目前來(lái)看,國(guó)內(nèi)大模型主流的商業(yè)化路徑有兩種:其一是以通用大模型為底座,接入如今豐富的移動(dòng)互聯(lián)網(wǎng)應(yīng)用生態(tài);其二是扎根某個(gè)垂類生態(tài),以特定的具體場(chǎng)景中產(chǎn)出的高質(zhì)量數(shù)據(jù)作為大模型的“涌現(xiàn)”能力的養(yǎng)料。只是在目前已公開的多條路徑中,B端場(chǎng)景占據(jù)多數(shù)。

這其實(shí)并不奇怪,面對(duì)涌現(xiàn)能力“大力出奇跡”的特點(diǎn),大模型訓(xùn)練往往耗資甚巨,落地的想象也浩如煙海。在重資產(chǎn)投入下,選擇在數(shù)據(jù)積累更厚、應(yīng)用更成熟的垂直領(lǐng)域落地,可以快速進(jìn)入自我造血的良性循環(huán)。而且,如果考慮成本回收以及變現(xiàn)問(wèn)題,付費(fèi)能力更強(qiáng)的B端自然是首選。

比較典型的是,僅4月期間,多家大模型宣布接入辦公場(chǎng)景,如協(xié)同辦公、辦公助手等。但阿里的野心卻遠(yuǎn)不止于此,電商起家的深刻烙印,讓阿里在大模型的商業(yè)化落地中將C端放在了與B端相等的位置上,借助已有的語(yǔ)音交互基礎(chǔ),早在通用大模型通義千問(wèn)面世前便以天貓精靈語(yǔ)音助手為載體,基于演員“鳥鳥”的類GPT應(yīng)用。

相比于需要“調(diào)教”的通用大模型以及偏向B端應(yīng)用的垂類大模型,接入大模型的天貓精靈demo可以應(yīng)對(duì)更復(fù)雜的交互場(chǎng)景,支持基于人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)。當(dāng)人類詢問(wèn)一個(gè)問(wèn)題(Query)時(shí),天貓精靈demo會(huì)首先經(jīng)過(guò)貓耳算法將其轉(zhuǎn)換為文本,隨后通過(guò)大模型產(chǎn)生個(gè)性化的對(duì)話回復(fù),最后再到個(gè)性化的語(yǔ)音合成給出回答。整個(gè)過(guò)程還有Multi-Turn對(duì)話系統(tǒng)來(lái)支持,確保低時(shí)延、支持多輪對(duì)話以及隨時(shí)打斷。

只是在接收并理解人聲信號(hào)的時(shí)候,天貓精靈demo還是出現(xiàn)了語(yǔ)義理解錯(cuò)誤的問(wèn)題。而且實(shí)際測(cè)試非常日常且生活化,對(duì)于復(fù)雜問(wèn)題的處理可能還沒(méi)到位。

更值得一提的是,天貓精靈demo所展現(xiàn)出的智能交互水平并非基于參數(shù)量在十萬(wàn)億以上的通義千問(wèn)大模型,而是基于相對(duì)更小、在外界看來(lái)是作為通用大模型“知識(shí)蒸餾”的中小模型。

資料顯示,天貓精靈接入的個(gè)性化大模型在參數(shù)規(guī)模上是億級(jí)到十億級(jí),通過(guò)針對(duì)消費(fèi)場(chǎng)景的不斷微調(diào)和強(qiáng)化學(xué)習(xí),以低于行業(yè)標(biāo)桿OpenAI研究的涌現(xiàn)參數(shù)標(biāo)準(zhǔn)做到了近似千億級(jí)大模型的生成水平,在計(jì)算資源消耗大幅降低的同時(shí)兼顧了清晰的商業(yè)模式。

這是國(guó)內(nèi)大模型進(jìn)一步有效控制大模型成本的“個(gè)性化”嘗試。雖然涌現(xiàn)能力原理的面紗還是未能揭開,但天貓精靈demo的出現(xiàn)顯然是大模型訓(xùn)練路線中的一次有效探索。

至于商業(yè)化的落地,天貓精靈demo也是業(yè)內(nèi)難得的面向消費(fèi)場(chǎng)景的大模型應(yīng)用。

無(wú)論是移動(dòng)互聯(lián)網(wǎng)應(yīng)用中催生的多元化平臺(tái)生態(tài),還是區(qū)塊鏈應(yīng)用催生的NFT、數(shù)字藏品,面對(duì)新生事物,C端用戶往往付費(fèi)意愿更強(qiáng)。造成這一現(xiàn)象的根本原因在于決策人,B端的決策人往往是企業(yè)領(lǐng)導(dǎo)、采購(gòu)部門,他們并非產(chǎn)品的直接使用者,而且需要考慮成本、預(yù)算、適用性等多個(gè)維度,而C端的決策者是自己,不僅更容易在大模型的認(rèn)知焦慮下驅(qū)使付費(fèi),決策相對(duì)非理性,而且成交周期短,更容易進(jìn)入自我造血的循環(huán)。

只是在類GPT應(yīng)用中,C端用戶由于GPT鎖區(qū)而苦于沒(méi)有落地產(chǎn)品可以使用和體驗(yàn),如今面世的大模型又將商業(yè)化重心落腳于B端。至少目前,阿里的天貓精靈AIGCdemo選擇了人數(shù)相對(duì)少的路徑,而且落地的想象也足夠豐富。

生活化的“無(wú)感”

既然個(gè)性化大模型和智能終端的結(jié)合是一個(gè)豐富、有落地應(yīng)用場(chǎng)景的方向,為何卻鮮少有人嘗試?這一問(wèn)題的答案或許能自元宇宙的前車之鑒中探求。

和元宇宙風(fēng)口相似,大模型的應(yīng)用同樣存在不同企業(yè)的認(rèn)知基礎(chǔ)上分化出的不同方向。只是曾經(jīng)的元宇宙卻無(wú)法為消費(fèi)者帶來(lái)足夠沉浸的體驗(yàn),而大模型卻具備這樣的潛力。

以如今大模型基本的NPL文本生成為例,我們僅需要登錄大模型的入口,輸入問(wèn)題指令即可快速獲得回答,而元宇宙所追求的沉浸式賽博空間,于消費(fèi)者而言不僅缺乏硬件設(shè)備支持,同時(shí)以目前公用網(wǎng)絡(luò)帶寬連云游戲都難以cover的情況,大量消費(fèi)者共處在某一個(gè)賽博空間中娛樂(lè)、生活的愿景只能停留在春秋筆法中,難以落地。

只是目前多數(shù)大模型也只是達(dá)到了消費(fèi)場(chǎng)景的初步需求。

在消費(fèi)場(chǎng)景中,用戶需要和追求的是“無(wú)感”的使用體驗(yàn),即要求更多具有沉浸感的交互能夠在無(wú)意識(shí)的情況下自然下發(fā)生。通常,“沉浸感”的說(shuō)法常常出現(xiàn)在游戲、XR等偏重虛擬現(xiàn)實(shí)體驗(yàn)的領(lǐng)域,而在在大模型需求的多模態(tài)交互語(yǔ)境下,沉浸感自然可以進(jìn)一步解釋為"無(wú)感"的交互方式。”

簡(jiǎn)單來(lái)說(shuō),即使做不到像3A大作一樣呈現(xiàn)光怪陸離的世界以供體驗(yàn),也需要像我們?nèi)粘3鲂兄袝?huì)無(wú)意識(shí)地打開天氣APP看看天氣,打開打車軟件叫個(gè)車。僅需簡(jiǎn)單對(duì)比使用體驗(yàn)便不難看出,目前對(duì)C端用戶的“無(wú)感”體驗(yàn)上,大模型玩家們的功力還遠(yuǎn)遠(yuǎn)不夠。

即使是被業(yè)內(nèi)奉為標(biāo)桿的ChatGPT,用戶在付費(fèi)使用時(shí)也需要經(jīng)歷解鎖設(shè)備、打開網(wǎng)頁(yè)、輸入對(duì)應(yīng)問(wèn)題三個(gè)環(huán)節(jié),期間還需要不斷通過(guò)prompt來(lái)獲取想要的內(nèi)容。至于當(dāng)下越來(lái)越多的、搭載在某個(gè)應(yīng)用生態(tài)的大模型,則與曾經(jīng)的元宇宙應(yīng)用相似。由于不能搶了平臺(tái)原生應(yīng)用的“風(fēng)頭”,往往需要用戶在平臺(tái)生態(tài)中找到入口,相對(duì)網(wǎng)頁(yè)載體更加麻煩。

換句話說(shuō),假設(shè)將大模型進(jìn)入我們?nèi)粘I畹臓顟B(tài)稱為 AI 2.0 ,如今的應(yīng)用體驗(yàn)充其量是 AI 1.5 。

這樣的儀式化過(guò)程就像早期的互聯(lián)網(wǎng),個(gè)人計(jì)算機(jī)只能通過(guò)電話線和網(wǎng)絡(luò)交換器核心進(jìn)行連接,并使用modem將電話線傳輸?shù)?00HZ到3400HZ的模擬信號(hào)波形轉(zhuǎn)換為計(jì)算機(jī)可以處理的信號(hào),因此彼時(shí)也將上網(wǎng)戲稱為“沖浪”。這樣的復(fù)雜流程天然與消費(fèi)場(chǎng)景相悖,即使大模型能憑借優(yōu)異的工具特性牢牢抓住老板和打工人們,也難以融入我們的日常生活之中。

與之相比,以智能硬件為入口反而是大模型接入日常消費(fèi)場(chǎng)景的一記“妙手”。

生活化才是未來(lái)

如果將時(shí)間回?fù)苤羶赡昵,那時(shí)無(wú)論是智能穿戴設(shè)備還是大模型,都不會(huì)想到今天兩者的結(jié)合。

彼時(shí)大模型只是在NPL(自然語(yǔ)言處理)、CV(計(jì)算機(jī)視覺(jué))兩條AI賽道爆發(fā)后的科研嘗試,以阿里為代表的頭部大廠將參數(shù)量卷到10萬(wàn)億級(jí)別時(shí),缺乏明確的商業(yè)路徑和巨大的算力投入讓大模型止步于研究階段。而智能穿戴設(shè)備同樣也走進(jìn)平臺(tái)期,相對(duì)普通用戶而言稍顯雞肋的豐富功能與品牌溢價(jià)讓增長(zhǎng)愈發(fā)乏力,入局者不得不將目光放向?qū)】倒δ芨鼮橹匾暤闹欣夏晔袌?chǎng)。

此外,兩者更大的相同點(diǎn)在于技術(shù)存在實(shí)際冗余。

由OpenAI測(cè)算出的大模型涌現(xiàn)規(guī)模是百億級(jí),可2021年,國(guó)內(nèi)的大模型的參數(shù)已經(jīng)卷上10萬(wàn)億。以天貓精靈demo為代表的智能眼鏡所需的骨傳導(dǎo)、算法、發(fā)聲單元或是其他智能穿戴設(shè)備的技術(shù)功能也日趨成熟。而更能體現(xiàn)技術(shù)冗余的,則是兩者在應(yīng)用形式上遲遲難以發(fā)生變化。

隨著時(shí)間的催化,技術(shù)上冗余會(huì)不斷匯聚,由此也有可能迸發(fā)出新的應(yīng)用形式。

只是業(yè)務(wù)方向的嘗試多種多樣,當(dāng)局者迷才是一眾先行者的眾生相。例如令曾在3G時(shí)代大力發(fā)展視頻通話業(yè)務(wù)的運(yùn)營(yíng)商始料不及的是,該業(yè)務(wù)會(huì)在4G時(shí)代進(jìn)入尋常百姓家。

回到天貓精靈一系列大模型測(cè)試之上,我們緣何判斷這將是一條可行路徑?

因?yàn)榫湍壳岸,demo作為新型應(yīng)用形式已經(jīng)達(dá)成了使用體驗(yàn)的躍進(jìn)。其一是智能穿戴設(shè)備所預(yù)設(shè)的實(shí)現(xiàn)用戶信息交互、人體健康監(jiān)測(cè)、健康放松及生活?yuàn)蕵?lè)等功能都可以在語(yǔ)音這一模態(tài)的輸出下得以觸達(dá),其二是大模型也能借由消費(fèi)品載體進(jìn)入我們的生活。

這條路徑的終點(diǎn),是人人都能擁有鋼鐵俠的賈維斯(漫威漫畫中的強(qiáng)人工智能)。

阿里巴巴集團(tuán)首席執(zhí)行官?gòu)堄略?月的阿里云峰會(huì)上說(shuō)的“所有產(chǎn)品都將接入AI大模型”所言非虛。只是根據(jù)實(shí)測(cè)結(jié)果,天貓精靈demo距離落地還有一段不小的距離。

在個(gè)性化大模型的訓(xùn)練中采用億級(jí)參數(shù),也可能商業(yè)化成本管控之下的結(jié)果,但這并不妨礙demo作為行業(yè)的一次有效創(chuàng)新。大模型的落地路徑無(wú)數(shù),如果大模型確是一次堪比第二次工業(yè)革命的浪潮,那么率先亮出“燈泡”以“先聲奪人”,不知這是否是一件好事。

       原文標(biāo)題 : 個(gè)性化大模型,將大開眼界

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)