訂閱
糾錯
加入自媒體

華為小藝做起“賈維斯”夢

ChatGPT帶火的大模型,在軟件應用領(lǐng)域一路高歌,與硬件設(shè)備的結(jié)合卻不疾不徐。

最先有動作的是微軟的老對頭谷歌。今年5月,后者公布新一代大語言模型PaLM 2,其代號為“壁虎”的版本,每秒可處理約20個Tokens(大約為16個單詞),適用于手機等移動設(shè)備,可以離線使用。并且,聯(lián)動谷歌旗下搜索、地圖、郵件、視頻等各類產(chǎn)品后,相應的功能可進行重構(gòu)。

大模型向手機端蔓延的戰(zhàn)火突然加速。6月29日,榮耀在上海世界移動通信大會上表示,未來將把AI大模型引入端側(cè)。7月初,搭載高通第二代驍龍8芯片的安卓手機,直接運行了參數(shù)規(guī)模超過10億的Stable Diffusion,只需要15秒左右就可以出圖。更重要的是,這是完全本地化,只依賴手機本身的算力。

8月初的華為開發(fā)者大會上,隨著HarmonyOS 4的發(fā)布,基于AI大模型的全新技術(shù),華為的智能語音助手小藝也公布了三大方向的優(yōu)化升級。

在華為的構(gòu)想中,旗下盤古大模型給小藝賦予的能力一改往日的呆板,看起來更加吸引人。但冷靜下來看,由ChatGPT引發(fā)的故事已經(jīng)老套,這時各大廠商們爆出將大模型接入智能手機,究竟是噱頭還是創(chuàng)新?

“人工智障”有了大腦

移動端的智能語音助手,在過去的很長一段時間內(nèi),被人戲稱為“人工智障”。

這種巨大的落差在于,藝術(shù)作品中的AI助手如《鋼鐵俠》中的賈維斯,拉高了人們的期待,而現(xiàn)實中無論是蘋果的Siri還是國產(chǎn)陣營的小愛、小度、小藝等,實際體驗都與智慧二字沾不上邊。大部分人或許有這樣的經(jīng)歷,對語音助手下達指令時,得到最多的回復是“我不太明白你在說什么?”,甚至沒有反應,不得不尷尬地喊話多次。

而在大模型的賦能下,用華為的話來說,小藝會變得“更聰明、更能干、更貼心”,在1+8設(shè)備操控、語音交互、文案幫寫等方面都能處理得游刃有余,能夠理解更為復雜的場景對話,輸出相應的交互動作和內(nèi)容。

這得益于華為早前在大模型領(lǐng)域的布局。今年7月7日的華為開發(fā)者大會2023(Cloud)上,華為常務(wù)董事、華為云CEO張平安就宣布推出盤古大模型3.0,通用大模型、行業(yè)大模型及更為細化的場景模型分別對應“L0~L2”三層模型架構(gòu),進而為行業(yè)提供大模型服務(wù)。

最新迭代的HarmonyOS 4就融入了自身盤古大模型底層能力,能為C端用戶帶來更智慧化、高效化、個性化的AI體驗。比如智慧助手小藝,在傳統(tǒng)的語音交互外,還擴展了文字、文檔、圖片等交互功能。用戶的表達可以更加模糊,口語化,能夠像與朋友交流一樣與小藝自然交互。

小藝背后的大模型就是在盤古L0基座大模型的基礎(chǔ)上,針對終端消費者場景構(gòu)建了大量的場景數(shù)據(jù)與精調(diào)模型后的L1層對話模型,進而適用于終端消費者場景。

不過,根據(jù)官方發(fā)布會以及線下體驗視頻來看,華為小藝確實展現(xiàn)出了如定鬧鐘、聽新聞、識別文字制作表格等,面對復雜內(nèi)容時的良好表現(xiàn)能力。但由于目前受制于鴻蒙系統(tǒng)的正式發(fā)布,小藝也只是公布了測試計劃:在今年8月底開放邀請測試,并于晚些時候在搭載HarmonyOS 4.0及以上的部分機型通過OTA升級體驗。也就是說,從目前華為公布的藍圖到落地,再到小藝融入尋常百姓家,這個過程中仍有著時間鴻溝。

參數(shù)、算力、能耗問題何解?

大模型顧名思義包含的參數(shù)規(guī)模是巨大的,訓練時的算力也成了關(guān)鍵。

中國工程院院士、鵬城實驗室主任高文把算力比作電力,認為沒有大算力做大模型就是天方夜譚。華為輪值董事長胡厚崑也提到,大模型訓練的效率或者是創(chuàng)新的速度,根本上取決于算力的大小。

因此,研發(fā)ChatGPT的OpenAI對英偉達A100/H100芯片的需求持續(xù)增加,訂單量超過數(shù)十億美元,并且造成了預計H100的43萬張缺口。同理,當手機上嵌入大模型后,其算力如何保證,以及算力背后的芯片性能如何提升,也影響著產(chǎn)品應用的使用體驗。

在能耗方面,榮耀CEO趙明表達過看法和擔憂:端側(cè)大模型在后臺不斷地運行,AI低功耗的能力未來會是一個核心。未來端側(cè)大模型的時代,一定對續(xù)航的體驗不會產(chǎn)生大的影響,實現(xiàn)路徑上會在“更聰明的AI”和“更優(yōu)的續(xù)航”之間做一個平衡。

因為表現(xiàn)良好的模型規(guī)模較大,所需要的存儲空間也越多,所以更大的模型也意味著在推理訓練和運算的過程中需要更多的能耗。而目前行業(yè)中對移動端大模型壓縮精簡的方法主要是,通過知識蒸餾、輕量化模型架構(gòu)、剪枝、量化等其中的一種或幾種方式進行壓縮后 “塞”到手機里,最終的能耗和續(xù)航表現(xiàn)也需要在實驗室測試完畢后才能拿到市場進行驗證。

最后還要考慮大模型訓練時所需要的數(shù)據(jù)參數(shù),放在手機上就是來自于語音助手的日常交互量。

據(jù)華為終端BG首席運營官何剛介紹,華為手機語音助手小藝月活用戶數(shù)超2億,智慧屏小藝日均喚醒次數(shù)為7次以上。而小米旗下的小愛同學截止到3月27日,月活用戶達 1.15億,語音交互次數(shù)累計達2158億;激活小愛同學的設(shè)備數(shù)達4.59億,小愛同學支持控制共79類,支持智能產(chǎn)品共計5312款。對于語音助手的覆蓋數(shù)量來看,想要達到大模型的千億級參數(shù)量級以便能有更為精準的交互和反饋,小藝、小愛同學還遠遠不夠看。

噱頭還是創(chuàng)新?

剛剛結(jié)束的小米新品發(fā)布會上雷軍提到,未來的小米將全面擁抱大模型,小愛同學也將第一時間用上大模型。與此同時有消息顯示,OPPO、vivo也都在發(fā)力于大模型領(lǐng)域,但最終的落地會稍晚一點。據(jù)國外媒體報道,蘋果也開始著急招聘大模型研發(fā)人才,其位于巴黎的AI研究所從Meta挖到了相關(guān)研發(fā)人員。

智能手機真的能在AI大模型的加持下,如愿捅破存量市場的天花板嗎?

一方面,部署在云端的人工智能算法和App,在手機這類設(shè)備中應用時,往往存在三個短板:服務(wù)響應延遲高、服務(wù)個性化不足、云端服務(wù)器壓力大。這不僅直接影響到用戶的產(chǎn)品體驗,而且會增加廠商對云服務(wù)器的采購成本。

而作為如今每年擁有十幾億出貨量的個人終端設(shè)備,智能手機就像是擁有大量閑置算力的移動計算單元,如果能在這些設(shè)備閑置時間里將碎片化、分布式的算力利用起來,對于廠商和用戶來說會是一種雙贏的局面。

另一方面,智能手機廠商們在高度同質(zhì)化的激烈競爭下,存量市場遲遲得不到突破,亟需新的技術(shù)和故事來拉動市場表現(xiàn)。而一直被認為是雞肋的語音助手剛好是用戶的智能化入口,在對用戶的個性化需求理解方面更具優(yōu)勢。

用語音助手來服務(wù)用戶的同時也面臨著一些爭議,比如訓練語言模型的數(shù)據(jù)是否合法?在這方面,華為表示堅持以安全與隱私保護為首要原則,主張更負責任的AI,所有AI體驗創(chuàng)新和場景設(shè)計的第一原則是安全與隱私保護。

AI大模型一日千里,其發(fā)展故事早已不夠稀奇和吸睛,但由于其表現(xiàn)出的巨大技術(shù)潛力,剛好符合智能手機廠商對未來的期待,想要徹底在端側(cè)引爆大模型,還需要時間來鑒定。

參考資料:

如何把大模型裝入智能手機?榮耀CEO趙明:低功耗的AI算力是關(guān)鍵-鈦極客

Google 的 AI 大計劃:讓大模型變小、嵌入每一個產(chǎn)品-晚點LatePost

AI大模型會如何顛覆手機?-阿爾法工場研究院

       原文標題 : 華為小藝做起“賈維斯”夢

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號