訂閱
糾錯(cuò)
加入自媒體

個(gè)性化大模型“裝進(jìn)”隨身終端,不是想象,是風(fēng)向

大模型時(shí)代下的應(yīng)用革命正在加速到來。

今年以來生成式AI與大模型的研究與應(yīng)用進(jìn)展高潮迭起,4月初天貓精靈一個(gè)接入了阿里大語言模型通義千問的個(gè)性化DEMO,徹底點(diǎn)燃了智能終端市場(chǎng)。更擬人的對(duì)話方式、更有情感的交互能力、人格化標(biāo)簽,打破了智能終端一度難以尋找新想象力的僵局。

然而就在近日,網(wǎng)上一款研發(fā)中的AIGC新型硬件demo——天貓精靈智能隨身眼鏡又引起了我們的關(guān)注。視頻中可以看出,雖然外觀、重量上該眼鏡與普通眼鏡相差無二,但有千問大模型樣機(jī)的加入使其能夠“才思敏捷”,骨傳導(dǎo)技術(shù)的加持也建立了一個(gè)相對(duì)私密對(duì)話環(huán)境。

例如UP主在吃飯時(shí)問道,“我好想吃面,可是我最近在健身,淀粉不能攝入過量怎么辦?”天貓智能眼鏡迅速給出了具體建議,“可以吃一些低熱量面食,蕎麥面、意大利面”;此外,后續(xù)UP在日常環(huán)境下與其交流愛好、游戲時(shí),天貓精靈智能眼鏡也能夠像朋友一樣對(duì)答如流。

500

事實(shí)上,ChatGPT類產(chǎn)品實(shí)現(xiàn)語義理解最快延伸出的場(chǎng)景,首先是文字,然后是圖像和語音,而考慮到語音輸入較文字輸入的便捷性和實(shí)用性,智能音箱、智能眼鏡、智能耳機(jī)等擁有語音交互能力的場(chǎng)景,可能會(huì)最先受益。

如果從場(chǎng)景倒推的話,更垂直的終端產(chǎn)品,也能在更垂直的大模型加持下,用更低的成本帶來更專業(yè)、更個(gè)性的體驗(yàn)。而在垂直之下,“微調(diào)模型+智能終端”的打法,也將會(huì)成為應(yīng)用升級(jí)的新風(fēng)向。

個(gè)性化大模型升溫

毋庸置疑,在行業(yè)共同作用下,大模型在通識(shí)任務(wù)上的表現(xiàn)越來越出色,基于超大規(guī)模語料訓(xùn)練的大模型在知識(shí)評(píng)測(cè)等任務(wù)上超越了人類平均水平。以ChatGPT等為代表的大模型出現(xiàn),更讓人切身感受到AI的智能水平。

然而這種以廣義理論框架搭建、公用數(shù)據(jù)訓(xùn)練出的通用大模型,對(duì)于普通用戶來說,在使用時(shí)也缺少個(gè)性,有時(shí)候更像是一個(gè)問答機(jī)器,而非像朋友一樣互相交流。

在主流通用大模型的基礎(chǔ)之上注入專業(yè)化、個(gè)性化是一個(gè)重要的探索方向,個(gè)性化大模型也逐漸成為“大模型時(shí)代”的另一種不同玩法。加入了人格化的標(biāo)簽、融入了更加細(xì)分領(lǐng)域的數(shù)據(jù)后,一個(gè)微調(diào)大模型會(huì)變得更加獨(dú)特有趣。

例如在辦公場(chǎng)景中,戴上眼鏡便可以通過語音命令操作電子郵件、日程安排,當(dāng)不清楚文檔內(nèi)容時(shí),還可通過詢問智能眼鏡口頭回答問題;在戶外露營時(shí),遇到陌生物種時(shí),可以通過語音描述,得到鑒定和解說。甚至在開車外出時(shí),可以通過眼鏡來尋找目的地并且導(dǎo)航路線。

500

另外,這款眼鏡本身是一個(gè)骨傳導(dǎo)眼鏡,技術(shù)核心在于用一種新的震動(dòng)發(fā)聲裝置,采用了振子專利技術(shù),搭配貓耳算法,讓設(shè)備不入耳就能聽到聲音,并且能夠有更小噪音、更低失真的聲音表現(xiàn)。

目前在實(shí)驗(yàn)環(huán)境下加入了千問大模型demo,大模型在進(jìn)行微調(diào)后,就能夠成為交互更加流暢智能的個(gè)性化隨身AIGC終端,可以支持佩戴者和眼鏡隨時(shí)進(jìn)行不間斷的語音交流,配合骨傳導(dǎo)的技術(shù)特點(diǎn),形成完全私密的聲場(chǎng)。

500

“骨傳導(dǎo)+定制大模型”的組合不僅僅可以應(yīng)用于眼鏡,也可以用于耳機(jī)、頭盔等穿戴設(shè)備中。這一定程度上也標(biāo)志著AIGC硬件會(huì)逐漸走入更加個(gè)人化的、隨身的垂直使用場(chǎng)景中。

事實(shí)上,相對(duì)于“廣而泛”的ChatGPT,垂直GPT的發(fā)展優(yōu)勢(shì)十分明顯。

個(gè)性化大模型多是以深度解決垂直領(lǐng)域問題為主,以產(chǎn)品開發(fā)為目的,即企業(yè)在自己擅長(zhǎng)的領(lǐng)域開發(fā)一個(gè)專業(yè)版大模型,然后直接應(yīng)用到自己的相關(guān)AI產(chǎn)品上,使該產(chǎn)品實(shí)現(xiàn)或增強(qiáng)某種功能。

并且從成本角度來看,個(gè)性化大模型是針對(duì)特定領(lǐng)域或行業(yè)進(jìn)行優(yōu)化,只需利用該領(lǐng)域內(nèi)的專業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練,避免了通用大模型數(shù)據(jù)采集的高成本和高難度。

錢學(xué)森在《系統(tǒng)工程論》提出這樣一個(gè)核心觀點(diǎn),那就是做任何技術(shù)產(chǎn)品,都要從現(xiàn)有條件出發(fā),不求單項(xiàng)技術(shù)的先進(jìn)性,只求總體設(shè)計(jì)的合理性,充分利用現(xiàn)有資源,各個(gè)子系統(tǒng)需要充分協(xié)作,服務(wù)于整體目標(biāo)。

把這個(gè)理論放在如今的大模型上,一樣適用。大模型再厲害,也只是一項(xiàng)技術(shù),它必須應(yīng)用到具體產(chǎn)品上,才能發(fā)揮最大作用。因此大模型并不是做得越大越通用就越好,而是應(yīng)該基于產(chǎn)品,聚焦在某個(gè)需求上,合理開發(fā)和利用,進(jìn)而實(shí)現(xiàn)大模型在產(chǎn)品中功能的最大化。

落地更快更真實(shí)

如果要說大眾對(duì)AIGC的終極幻想,那一定是人均一個(gè)賈維斯這樣的全能助手,這也是目前行業(yè)的終極目標(biāo)。

雖然大模型技術(shù)打破了AI難以用于不同領(lǐng)域的壁壘,加上多模態(tài)的快速發(fā)展,智能助理的發(fā)展方向一定是越來越全能,但不得不承認(rèn)的是,科幻電影中的賈維斯離我們還很遙遠(yuǎn)。

不過目前可以實(shí)現(xiàn)的是,利用個(gè)性化大模型具備的專業(yè)性、獨(dú)特性、定制性,微調(diào)出針對(duì)不同應(yīng)用場(chǎng)景的智能助理,并且快速落地、快速應(yīng)用,落地到消費(fèi)端的產(chǎn)品上。

例如前不久爆火的接入了千問大模型的Sound Pro,通過知識(shí)增強(qiáng)、工具增強(qiáng)、個(gè)性化對(duì)話增強(qiáng)、人類反饋強(qiáng)化學(xué)習(xí),四個(gè)訓(xùn)練步驟便實(shí)現(xiàn)了“知識(shí)+情感+記憶+人設(shè)”統(tǒng)一體驗(yàn),在接入天貓精靈后能夠?qū)崿F(xiàn)多輪流暢對(duì)答、符合人設(shè)的人格化表達(dá)、富有創(chuàng)意的隨機(jī)創(chuàng)作等能力,被稱為“鳥鳥分鳥”。這本質(zhì)上是“個(gè)性化”大模型,能夠塑造特定的人格化特征,對(duì)“看法是什么”、“喜歡吃什么”等開放式問題作出符合自身“人設(shè)”的個(gè)性化回答。

比如問大模型“怎樣做一道美味的意大利面?”,設(shè)定為專業(yè)廚師的大模型可能會(huì)分享正宗的意大利面做法,例如使用哪種面粉、如何制作面團(tuán)、如何制作醬汁等等;而一位素食主義者大模型可能會(huì)提供素食意大利面的做法,例如使用哪些蔬菜和豆類代替肉類等。

這些高可玩性與可用性,給語音交互注入了前所未有的生命力,讓行業(yè)初步看到大模型所激發(fā)的交互躍遷。

當(dāng)然,除了以家庭中心為入口的智能設(shè)備外,終端穿戴式AIGC產(chǎn)品想象力更為豐富。因?yàn)槿祟愇锢項(xiàng)l件限制,在許多場(chǎng)景最合適的語音智能載體還是耳機(jī)或者鋼鐵俠那樣的眼鏡。除非腦機(jī)接口或其它新技術(shù)突破,目前語言依然是人類交流的最通用方式,也是與智能助理交流的最佳方式。

更聰明的交互、更豐富的終端

2021年以來,傳統(tǒng)智能音箱行業(yè)面臨需求下滑、創(chuàng)新不足的困境。出貨大跌的原因也不模糊,隨著消費(fèi)者的認(rèn)知回歸理性,交互模式機(jī)械化、產(chǎn)品嚴(yán)重同質(zhì)化的智能硬件產(chǎn)品早已算不上新穎,且智能家居的“入口”概念早已淡化。

用戶希望與智能音箱、手表等智能終端設(shè)備實(shí)現(xiàn)類似人與人之間的“對(duì)話式”交流,但多數(shù)設(shè)備無法理解復(fù)雜的語言場(chǎng)景,只能實(shí)現(xiàn)播放音樂、天氣查詢、快遞查詢等簡(jiǎn)單的功能,并且現(xiàn)階段沒能依靠技術(shù)或內(nèi)容或某一特征打動(dòng)更多消費(fèi)者。

另外雖然眾多終端配備了兒童模式、老人模式、青少年模式等個(gè)性化模式,但在實(shí)際使用中,除了內(nèi)容上的些許不同,其他方面并未像“鳥鳥分鳥”那樣真正的有個(gè)性。

方正證券認(rèn)為,智能音箱需要更加“智能”,才能找到自己的獨(dú)特定位,得到長(zhǎng)足發(fā)展,而ChatGPT這類生成式AI具有智能對(duì)話、多模態(tài)表達(dá)的支持,對(duì)于智能音箱等都是可以彌補(bǔ)缺陷的方案。

比如將這種個(gè)性化定制的大模型可能和圖像生成聯(lián)系在一起,激發(fā)更多潛能。如為每臺(tái)音箱、智能眼鏡等智能終端產(chǎn)品裝備一個(gè)虛擬數(shù)字人管家,通過用戶的訓(xùn)練掌握用戶的日常習(xí)慣,做到更私人、更個(gè)性。

行業(yè)的底層邏輯是產(chǎn)品周期,周期的強(qiáng)度取決于產(chǎn)品創(chuàng)新與痛點(diǎn)挖掘。目前行業(yè)處于庫存逐步去化、周期將起未起的拐點(diǎn)時(shí)刻。對(duì)于企業(yè)來說,當(dāng)下已經(jīng)過了爭(zhēng)奪“入口”的階段,而大模型的爆發(fā)也促進(jìn)了軟硬一體的生態(tài)發(fā)展,所以,從實(shí)際體驗(yàn)出發(fā),尋找更聰明的交互、更豐富的AIGC終端形態(tài),不拘泥于單個(gè)“入口”,才是未來各大廠商角逐的方向。

據(jù)不完全統(tǒng)計(jì),目前除了天貓精靈在深耕“大模型+智能硬件”外,百度旗下的小度科技也宣布將融合文心一言,打造針對(duì)智能設(shè)備場(chǎng)景的人工智能模型“小度靈機(jī)”,并且應(yīng)用到小度全系產(chǎn)品;科大訊飛也將其星火大模型落地應(yīng)用層,融合進(jìn)了訊飛智能辦公本中。

在「科技新知」看來,“個(gè)性化大模型”有望成為引爆下一輪產(chǎn)品創(chuàng)新的關(guān)鍵,不僅僅是文本、語音交互,圖像、視頻甚至手勢(shì)動(dòng)作都有望實(shí)現(xiàn)革新,而隨之帶來的便是,更多AIGC智能硬件的涌現(xiàn),以及整個(gè)行業(yè)的二次爆發(fā)。

       原文標(biāo)題 : 個(gè)性化大模型“裝進(jìn)”隨身終端,不是想象,是風(fēng)向

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)