訂閱
糾錯
加入自媒體

重讀百度:文心一言意味著什么?

2023-02-23 10:35
新熵
關(guān)注

AI原生時代正在加速到來。

@新熵 原創(chuàng)

作者丨樟稻  編輯丨伊頁

2022年11月30日,人工智能領(lǐng)域可能也迎來了與網(wǎng)景導(dǎo)航者的問世同樣重要的關(guān)鍵時刻。當(dāng)天,OpenAI的首席執(zhí)行官山姆·阿爾特曼發(fā)推文稱:“今天我們發(fā)布了ChatGPT。歡迎點(diǎn)擊這里與它聊天!

沒承想,這一應(yīng)用以迅雷不及掩耳之勢成為眾人茶余飯后討論的話題。據(jù)瑞銀的一份報告顯示,在ChatGPT推出僅兩個月后,它的月活用戶已經(jīng)突破1億,成為史上用戶增長速度最快的消費(fèi)級應(yīng)用程序。

隨著ChatGPT的爆火,眼下其產(chǎn)生的巨大吞噬力如同黑洞一般,吸引著國內(nèi)外各大科技互聯(lián)網(wǎng)企業(yè),紛紛宣布要在ChatGPT背后的大語言模型賽道布局。

在外界看來,大語言模型的成熟是人工智能里程碑,更是分水嶺,這意味著AI技術(shù)發(fā)展到臨界點(diǎn),也同樣預(yù)示著將對原有商業(yè)模式進(jìn)行重塑。由于大語言模型影響最大的將是搜索引擎行業(yè),市場紛紛聯(lián)想到百度。

作為國內(nèi)搜索引擎和人工智能的代表,百度自然不會錯過這次機(jī)會。此前在2月7日,百度確認(rèn)大語言模型名為“文心一言”,英文名“ERNIE Bot”,預(yù)計三月份完成內(nèi)測,面向公眾開放。

就在2023年2月22日,百度發(fā)布了截至2022年12月31日的第四季度及全年未經(jīng)審計的財務(wù)報告。2022年,百度實(shí)現(xiàn)營收1236.75億元,歸屬百度的凈利潤(非美國通用會計準(zhǔn)則)206.8億元,同比增長10%。第四季度,百度實(shí)現(xiàn)營收330.77億元,歸屬百度的凈利潤(非美國通用會計準(zhǔn)則)53.71億元,同比增長32%。2022財年,百度核心連續(xù)四個季度業(yè)績超市場預(yù)期。

輔以財報數(shù)據(jù),我們可以嘗試探尋,在人工智能領(lǐng)域深耕數(shù)十年的百度,能否乘文心一言東風(fēng)完成自我變革,引發(fā)行業(yè)“重讀”。

01

搜索的代際變革

早在ChatGPT發(fā)布的第一天,就有生成式AI要取代搜索引擎的聲音出現(xiàn),原因在于,ChatGPT本質(zhì)上是自然語言生成式AI,天然適用于搜索場景,提供高度智能的對話式搜索結(jié)果。

對此,行業(yè)形成的共識是,ChatGPT在中短期內(nèi)仍無法完全取代傳統(tǒng)搜索引擎,但將會加速搜索引擎演化進(jìn)程,并在中期形成以傳統(tǒng)搜索為主、ChatGPT類模型為輔的新搜索引擎形態(tài)。也就是說,生成式AI是搜索引擎的新奇點(diǎn)。

這與百度的想法不謀而合。

今年1月Create AI開發(fā)者大會前夕,百度搜索宣布將基于百度自研的生成式模型,升級“生成式搜索”能力,并指出,生成式AI和搜索引擎是互補(bǔ)關(guān)系而不是替代,搜索底層技術(shù)和AI底層技術(shù)是相通的。

更早之前,百度董事長兼首席執(zhí)行官李彥宏曾在一場內(nèi)部直播中表示,AIGC(AI生成內(nèi)容)和ChatGPT這些都是AI技術(shù)發(fā)展到一定地步后產(chǎn)生的新機(jī)會!斑@個事情很難,但百度必須要做!

彼時,市場還在觀望百度將如何參與這場熱潮,答案很快被揭曉——2023年2月7日,百度官宣即將發(fā)布的大模型新項目:文心一言(英文名ERNIE Bot)。

此后時隔一日,經(jīng)媒體披露,百度董事長兼首席執(zhí)行官李彥宏2023年一季度OKR關(guān)鍵任務(wù)為“引領(lǐng)搜索體驗的代際變革”。顯然,文心一言將在這輪變革中起到核心作用。

譬如,文心一言是搜索引擎實(shí)現(xiàn)“模糊搜索”到“精準(zhǔn)推送”跨越的關(guān)鍵:生成式AI問世之前,搜索引擎以“模糊搜索”為主,用戶需要根據(jù)在搜索引擎中打入關(guān)鍵字找到需要的內(nèi)容或鏈接,而通過文心一言,用戶可以通過自然語言交互的方式輕松獲得需要的內(nèi)容或鏈接,且內(nèi)容較為精準(zhǔn),即“精準(zhǔn)推送”。

與此同時,生成式內(nèi)容也會極大豐富內(nèi)容生態(tài)和內(nèi)容供給,讓成熟的搜索業(yè)務(wù)和搜索體驗煥發(fā)生機(jī)。這在于,決定一個內(nèi)容產(chǎn)品平臺優(yōu)質(zhì)與否最關(guān)鍵的因素是內(nèi)容數(shù)量、內(nèi)容質(zhì)量、客戶互動。

從這個角度來看,文心一言勢必提高百度在內(nèi)容層面的核心驅(qū)動力。例如,文心一言可有效對已有信息進(jìn)行語言整合、文字輸出,人類只需扮演提供靈感的角色,AI將協(xié)助創(chuàng)作過程生成個性化的文本內(nèi)容。

至于被市場關(guān)注的生成式AI整合進(jìn)搜索引擎對于商業(yè)模式的挑戰(zhàn),百度并沒有這方面的擔(dān)憂。

首先,百度營收更趨多元化,非廣告營收占比逐季增加。根據(jù)財報數(shù)據(jù),2022年Q4,百度核心收入為257億元人民幣 ,其中,廣告收入為181億元人民幣,非廣告收入為76億元人民幣,同比上升11%,主要受百度智能云及其他AI驅(qū)動業(yè)務(wù)的推動。

其次,文心一言對于廣告業(yè)務(wù)更是一次重大利好。原理很簡單,有機(jī)器學(xué)習(xí)行業(yè)人士解釋道,“從商業(yè)模式的角度,廣告業(yè)務(wù)最大的關(guān)鍵點(diǎn)是平臺的控制力,平臺的控制力越大,粒度越細(xì),變現(xiàn)的空間越大!

可以預(yù)見的是,伴隨文心一言接入搜索,除開因文心一言帶來的DAU及用戶使用時長的攀升,同時搜索將能夠充分利用類ChatGPT技術(shù)完善升級,形成搜索代際變革。

02智能云有了最新解

文心一言為搜索業(yè)務(wù)帶來的改變毋庸置疑,而在搜索之外,一場云計算行業(yè)的“AI浪潮”,也正在醞釀當(dāng)中。

需要了解到,百度整體劃分為三條核心業(yè)務(wù)線,一是成熟的移動生態(tài)業(yè)務(wù),二是快速發(fā)展的智能云業(yè)務(wù),三是未來硬科技的智能駕駛業(yè)務(wù)。當(dāng)下,智能云已經(jīng)成為百度的第二增長曲線。

今年1月5日,IDC發(fā)布《2022 H1中國AI云服務(wù)市場研究報告》,數(shù)據(jù)顯示,AI公有云服務(wù)廠商市場格局相對穩(wěn)定,2022上半年百度智能云仍然穩(wěn)居第一,整體市場份額占比28.1%,這也是百度智能云連續(xù)四年市場份額第一。

從這方面來看,憑借智能云“云智一體”的獨(dú)特競爭優(yōu)勢,百度將幫助企業(yè)實(shí)現(xiàn)云和AI技術(shù)與業(yè)務(wù)實(shí)踐的結(jié)合,為企業(yè)實(shí)現(xiàn)全場景的解決方案,加速企業(yè)數(shù)字化轉(zhuǎn)型、產(chǎn)業(yè)智能化升級進(jìn)程。

眼下,在ChatGPT爆火后,微軟宣布Azure OpenAI服務(wù)全面上市,通過該服務(wù)可以訪問OpenAI開發(fā)的AI模型。目前,已經(jīng)使用該服務(wù)的客戶有半導(dǎo)電視臺、畢馬威、RPA廠商Moveworks等等。

對于微軟而言,自2017年轉(zhuǎn)變戰(zhàn)略,由“移動為先,云為先”轉(zhuǎn)向“智能云、智能邊緣計算”,為AI、云計算、數(shù)據(jù)等領(lǐng)域服務(wù),AI已經(jīng)成為微軟贏得下一時代的重要棋子,也是此次從ChatGPT受益的前提。

而百度也可將文心一言通過百度智能云提供給企業(yè)和機(jī)構(gòu)客戶,在同一思路下,文心一言將作為云業(yè)務(wù)的一部分,為百度智能云贏下更多的市場空間。

如同百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖所述,文心一言是基于百度智能云技術(shù)打造出來的大模型,它將根本性地改變云市場的游戲規(guī)則,云服務(wù)將從數(shù)字時代躍遷到智能時代。

這里其實(shí)還有一筆“隱藏收入”。考慮國內(nèi)生成式AI的創(chuàng)業(yè)潮攀升,算力需求將成為擺在面前的一大問題。對此,根據(jù)投資機(jī)構(gòu)A16Z最新推測,生成式AI市場里的大量資金,其實(shí)最終流向了基礎(chǔ)設(shè)施公司。

A16Z估計,應(yīng)用程序公司平均將約20%-40%的年收入,用于推理和定制化的微調(diào)。這部分通常直接支付給云服務(wù)提供商以獲取實(shí)例,或支付給第三方模型提供商,后者將大約一半的收入投入于云基礎(chǔ)設(shè)施。

除此之外,訓(xùn)練著自有模型的初創(chuàng)公司們,已經(jīng)籌集了數(shù)十億美元的風(fēng)險投資,其中大部分(早期階段高達(dá)80%-90%)通常也花在云服務(wù)提供商身上。

據(jù)此,有理由推測,生成式AI總營收的10%-20%將流向云服務(wù)提供商。百度作為在AI領(lǐng)域最有話語權(quán)的國內(nèi)云廠商,無疑是生成式AI初創(chuàng)公司的最佳選擇。

總體而言,伴隨大模型、AIGC為代表的AI應(yīng)用不斷成為行業(yè)熱議話題,AI原生時代正在加速到來。而早期就選擇在智能云方向深耕的百度,理所當(dāng)然成為國內(nèi)最為受益的云廠商。03借由文心一言,重讀百度

眼下,國內(nèi)眾多科技企業(yè)紛紛開啟軍備競賽,一個問題也隨之被拋出,誰能在大語言模型的競爭中搶占先機(jī)?從這個角度來看,已經(jīng)有超過20年發(fā)展歷史、最鮮明的標(biāo)簽始終是AI的百度,無疑是“無冕之王”。

早在2010年,百度開始探索AI技術(shù),成為中國最早布局AI技術(shù)的巨頭企業(yè)。在這十年中,百度在AI技術(shù)研發(fā)上的投入早已超過1000億元,幾乎構(gòu)成了百度過去十年的主旋律。

從本次財報中也能看到,2022全年,百度核心研發(fā)費(fèi)用達(dá)到214.16億元,占百度核心收入比例達(dá)22.4%。過去十年,百度的年研發(fā)投入占營收比例均超過15%。

持續(xù)高強(qiáng)度研發(fā)投入,使百度的AI 技術(shù)全面領(lǐng)先。根據(jù)《2022 年百度人工智能專利白皮書》,截至2021年底,百度全球人工智能專利申請超2.2萬件,其中中國專利申請量超1.6萬件,授權(quán)專利超4600件。

去年12月27日,百度智能云發(fā)布國內(nèi)首個全棧自研的AI基礎(chǔ)設(shè)施“AI大底座”,并全面升級25項產(chǎn)品和技術(shù)。簡單來說,AI原生時代,百度把芯片、大模型、深度學(xué)習(xí)框架等高門檻的技術(shù),變成像水電一樣供客戶按需取用。

聚焦到開發(fā)大語言模型需要的技術(shù)上。人工智能的快速發(fā)展依賴于三個核心要素:數(shù)據(jù),算法,算力,在這三項上,百度在芯片層、框架層、模型層和應(yīng)用層進(jìn)行全方位布局,具備堅實(shí)技術(shù)底座。

數(shù)據(jù)層面,大語言模型訓(xùn)練使用主要來自互聯(lián)網(wǎng)的文本數(shù)據(jù)庫,而百度的搜索業(yè)務(wù)在真實(shí)數(shù)據(jù)和用戶需求理解方面積累有先發(fā)優(yōu)勢,這些大規(guī)模結(jié)構(gòu)化非結(jié)構(gòu)化數(shù)據(jù)有望支撐文心一言的充分預(yù)訓(xùn)練。

算力、算法層面,百度自研AI芯片昆侖,可為不同場景中的AI應(yīng)用提供多元化、高性能、彈性易運(yùn)維的算力服務(wù)。此外,百度擁有多個云計算可用區(qū)、龐大的超算集群,奠定大模型訓(xùn)練的基礎(chǔ)設(shè)施。

再結(jié)合與GPT3大模型對標(biāo)的百度文心大模型——2021年發(fā)布的“鵬城-百度·文心”(ERNIE 3.0 Titan)參數(shù)規(guī)模已達(dá)到2600億,是目前全球最大的中文單體模型。

從這幾方面來看,得益于四層技術(shù)棧,在大語言模型相關(guān)技術(shù)的科技競賽中,百度在中國乃至全球范圍均具有綜合優(yōu)勢。

據(jù)了解,目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險、汽車、企業(yè)軟件等行業(yè)的近300家頭部企業(yè)宣布加入百度文心一言生態(tài),百度的AIGC生態(tài)圈已初具雛形并即將快速拓展。

隨著文心一言商業(yè)生態(tài)的逐漸成熟,后續(xù)對百度業(yè)務(wù)(搜索、云業(yè)務(wù))帶來的賦能,勢必將引發(fā)行業(yè)“重讀”寄身于AI信仰的百度。

       原文標(biāo)題 : 重讀百度:文心一言意味著什么?

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號