午夜无码有线中文影视,人妻少妇乱子伦无码视频专区,CHINESE国产HD中国熟女

李彥宏不寒磣：不賺錢，做大模型干嗎？

2024-04-19 14:02

在商言商，只要未被利益蒙蔽雙眼，因商業(yè)利益而為自家產(chǎn)品、技術(shù)路線強(qiáng)硬站臺，無可厚非。對李彥宏和他的百度來說顯然也是如此，其既不是發(fā)布會上鼓吹的“讓人人都是開發(fā)者”的那樣高尚，也不是周鴻祎反駁中的“胡說八道和忽悠”。

作者|Cindy

編輯|劉珊珊

一位行業(yè)領(lǐng)袖對技術(shù)路線的斷言甚至是“拉踩”，其影響，或許將遠(yuǎn)超公眾預(yù)判。

“開源模型會越來越落后。”Create 2024百度AI開發(fā)者大會上，一襲白衣的百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏，斷言稱，“大家以前用開源覺得開源便宜，其實(shí)在大模型場景下，開源是最貴的。”

這是數(shù)天內(nèi)，Robin對開源大模型潑下的第二瓶冷水——此前4月11日，李彥宏在內(nèi)部信中也稱，大模型開源意義不大。

作為國內(nèi)大模型較早入局者，百度在去年3月發(fā)布文心一言大模型，選擇走閉源路線。一年間，文心大模型已迭代至目前的4.0。

李彥宏觀點(diǎn)在行業(yè)內(nèi)引發(fā)不小爭議，認(rèn)為以他國內(nèi)AI布道者地位，不應(yīng)如此武斷。畢竟，開源創(chuàng)新力量幾乎被每一位開發(fā)者公認(rèn)，整個互聯(lián)網(wǎng)都建立在開源基礎(chǔ)上，才有了如今信息世界的暢通無阻。

因此也有多位現(xiàn)場媒體人猜測，李彥宏是否在暗指或diss行業(yè)其他閉源模型。

“百模大戰(zhàn)”如火如荼，行業(yè)大佬下場對壘成為常態(tài)。如百川智能創(chuàng)始人兼首席執(zhí)行官王小川，今年3月因李彥宏“文心一言4.0在中文處理上已經(jīng)超越了ChatGPT 4.0”的表態(tài)，與百度高管多次互嗆。

自稱“開源信徒”的360創(chuàng)始人周鴻祎，截至目前已連續(xù)兩次（4月13日、4月18日）在公開場合炮轟李彥宏言論，他表示沒有開源，就沒有Linux、沒有互聯(lián)網(wǎng)，“開源不如閉源好是胡說八道，是忽悠，連說這話支持閉源的公司都是靠開源才發(fā)展起來。”

值得一提的是，百川智能、360都是開源大模型。而大模型開閉源之爭，也早是業(yè)界兩大陣營爭論話題，從去年7月Llama 2宣布開源可直接商用就已開始，并在最近馬斯克起訴OpenAI，要求OpenAI恢復(fù)開源并給予賠償后，掀起廣泛爭論。

一切技術(shù)路線爭議終點(diǎn)，是需要商業(yè)化掙錢。大模型加速商業(yè)化下半場，對“all in”人工智能的百度來說，作為國內(nèi)最早利用通用大模型會員付費(fèi)模式，向C端用戶收費(fèi)企業(yè)，依靠大模型搞錢想法之迫切顯而易見——此前內(nèi)部信中，李彥宏說得很直接：閉源才有真正的商業(yè)模式。才能夠真正賺到錢的，能夠賺到錢才能聚集算力、聚集人才。

從這個角度看，不賺錢，還做大模型干嗎？這并不寒磣。但問題是，僅選擇開閉源任一道路，是否在通向極端？開源是否真的落后于閉源？閉源是否能真正代表大模型“商業(yè)化”破局之道？

開源一直領(lǐng)先閉源？

在李彥宏看來，無論是技術(shù)還是商業(yè)模式上，閉源模型都會持續(xù)地領(lǐng)先，而不是一時領(lǐng)先。

開源和閉源區(qū)別上，TechTarget在一篇文章中解釋，開源意味著公開AI模型、訓(xùn)練數(shù)據(jù)和底層代碼，閉源則隱藏或保護(hù)其中一項或多項。

可以簡單理解為，開源模型注重開放、共享和協(xié)作，推動大模型創(chuàng)新；閉源意味著源代碼僅供擁有它的公司修改和開發(fā)，但能更好保護(hù)商業(yè)利益和技術(shù)優(yōu)勢。

從陣營來看，開源陣營遠(yuǎn)比閉源龐大。目前國內(nèi)外大模型行業(yè)，閉源主要以O(shè)penAI GPT、百度文心一言為代表，開源則是Meta旗下Llama（羊駝）、馬斯克旗下 xAI 公司的 Grok-1，以及國內(nèi)阿里通義千問、百川智能、360、昆侖萬維、智譜AI等。其中，有不少企業(yè)選擇“兩條腿走路”，既做開源又做閉源。

從普通用戶應(yīng)用/產(chǎn)品化影響力來看，閉源目前領(lǐng)先開源毫無疑問。李彥宏核心論斷之一也是，無論中美，當(dāng)前最強(qiáng)基礎(chǔ)模型都是閉源。

當(dāng)前“登上神壇”，讓很多大模型有絕望感覺的OpenAI，2019年發(fā)布GPT-2時還是開源，此后從GPT-3開始轉(zhuǎn)變?yōu)殚]源，推出“核爆”聊天機(jī)器人ChatGPT后，才震驚世界。

最初，OpenAI還公布論文，但到GPT-3.5、GPT-4，連算法、路線、論文都“諱莫如深”。今年初推出Sora時，更是明確表示不分享技術(shù)實(shí)現(xiàn)細(xì)節(jié)，只提供模型設(shè)計理念及其“炫酷”效果展示。

毫無疑問，大模型賽道近兩年繁榮，很大程度上得益于OpenAI帶動——倘若沒有ChatGPT，不會有如此多科技企業(yè)加入大模型賽道，更不會有百花齊放、百家爭鳴的行業(yè)形態(tài)。

在國內(nèi)，文心一言是閉源代表。根據(jù)李彥宏最新公布的數(shù)據(jù)，文心一言用戶數(shù)、API日均調(diào)用量均突破2億。百度在大模型賽道初步建立起自己AI生態(tài)。

今年格外火爆，引發(fā)大模型巨頭“圍剿”的初創(chuàng)公司月之暗面旗下產(chǎn)品Kimi，也是閉源大模型。

大模型爆炒背景下，以上簡單易用、面向To c的閉源大模型可謂盡人皆知，在當(dāng)下成功占據(jù)市場主導(dǎo)地位——但未來是否能保持當(dāng)下優(yōu)勢，尚未定論。

大獲好評的Llama 2后，開源逐漸成為大模型主流趨勢，其進(jìn)化速度越來越快，迅速成為大模型競爭重要一極。

3月底，也就是Grok-1公開后幾天后，初創(chuàng)公司Databricks公布旗下開源大模型DBRX，基于混合專家（MoE）架構(gòu)，在語言理解、編程、數(shù)學(xué)和邏輯等標(biāo)準(zhǔn)行業(yè)上，戰(zhàn)勝了Llama2-7B、Mixtral 以及Grok-1。整體性能超越GPT-3.5，編程方面更是輕松擊敗GPT-3.5。

根據(jù)最新消息，Meta將在下個月發(fā)布Llama 3，支持多模態(tài)處理。屆時，Llama 3或又將超越DBRX，直接對標(biāo)GPT-4，復(fù)現(xiàn)后者大部分能力。

多位業(yè)內(nèi)人士認(rèn)為，如無意外，Meta將遵循Llama 2路線，將Llama 3訓(xùn)練數(shù)據(jù)、訓(xùn)練方法、數(shù)據(jù)標(biāo)注等大量細(xì)節(jié)都公布，成為“任何人都可以拿到模型權(quán)重的最強(qiáng)大語言模型”。同樣，DBRX為開放社區(qū)和企業(yè)提供了僅限于封閉模型的API功能。

過去，閉源大模型有“遙遙領(lǐng)先”的參數(shù)。如今開源模型參數(shù)正越來越大，DBRX參數(shù)規(guī)模達(dá)1320億，Grok有3140億，Llama 3預(yù)計其大規(guī)模版本參數(shù)量可能超過1400億。國內(nèi)昆侖萬維也在4月17日宣布開源4000億參數(shù)的大模型天工3.0，一躍成為全球參數(shù)最大開源大模型，號稱超越GPT-4V。盡管相比閉源大模型萬億參數(shù)有距離，但追趕速度越來越快。所以谷歌工程師說，谷歌沒有護(hù)城河，OpenAI也沒有。

對諸多開源大模型——特別是中國大模型賽道創(chuàng)業(yè)者而言，拉平認(rèn)知的Llama，事實(shí)上遠(yuǎn)比GPT更為重要。不少行業(yè)、垂直大模型多是通過對Llama等開源大模型進(jìn)行微調(diào)或修改實(shí)現(xiàn)。“如果沒有Llama，國內(nèi)大模型整體水平會被國外甩下不少身位。”

“無需閉門造車，重復(fù)發(fā)明輪子。”周鴻祎和金沙江創(chuàng)投主管合伙人朱嘯虎等均認(rèn)為，開源社區(qū)聚集的工程師和科學(xué)家的數(shù)量是閉源的數(shù)百倍，借助全球技術(shù)力量，實(shí)現(xiàn)迭代、體驗改進(jìn)和生態(tài)擴(kuò)張。“開源會很快超過閉源。”

但李彥宏并不認(rèn)可這種說法，他表示大模型開源跟Linux、安卓不同，實(shí)際上最主要開發(fā)者就是Meta，“不是一個真正大家一起來協(xié)同開發(fā)的產(chǎn)品。”

開源成本真比閉源貴?

兩大陣營最激烈交鋒，目前發(fā)生在馬斯克與OpenAI之間——2016年，馬斯克還是OpenAI聯(lián)合創(chuàng)始人、投資人、聯(lián)席CEO，如今早已徹底走向決裂。

自ChatGPT發(fā)布后，馬斯克多次暗諷OpenAI，斷掉OpenAI對推特的數(shù)據(jù)訪問權(quán)限，并在今年2月克起訴OpenAI跟山姆·奧特曼，理由是OpenAI違背了造福人類非營利的宗旨。

整體來看，伴隨兩大陣營的交鋒態(tài)度日益強(qiáng)硬，誰也說服不了誰。開源陣營認(rèn)為，開源更容易創(chuàng)新，更容易被大眾理解和監(jiān)督，閉源是奉行保守主義，容易權(quán)力集中，壟斷市場和數(shù)據(jù)，AI技術(shù)發(fā)展也會滯后。

閉源陣營則認(rèn)為，開源模型是套殼，存在濫用風(fēng)險，無法基于此自行演進(jìn)，影響某些企業(yè)商業(yè)化策略，特別是注重安全、隱私的企業(yè)。

但從李彥宏論斷來看，開源模型會一直越來越落后，核心論點(diǎn)是因為成本更昂貴——這是行業(yè)最新爭議點(diǎn)，畢竟印象中，開源使用成本更低甚至免費(fèi)，而且開源成本的高低，從邏輯而言并不等于技術(shù)路線的高低。

李彥宏的依據(jù)是，基于文心大模型4.0，降維裁剪出來的“小模型”，要比直接拿開源模型調(diào)出來的模型，同等尺寸下效果明顯更好；同等效果下，成本明顯更低。

這話有一定道理，此前有業(yè)內(nèi)人士就在X平臺表示，Grok-1沒有對特定任務(wù)進(jìn)行微調(diào)，普通用戶使用它的基礎(chǔ)門檻并不低。如何開源、什么可以開源、開源到何種程度仍有待實(shí)踐回應(yīng)。

但也有中小開發(fā)者表示，盡管Llama2的開發(fā)和使用并沒有完全面向全體公眾開放，但對中小開發(fā)者也非常友好，只需一臺PC就可以零代碼微調(diào)大模型，花不了多少錢，且性能并不差。

事實(shí)上，業(yè)內(nèi)公認(rèn)的是，當(dāng)前大模型技術(shù)路線都未成熟，包括ChatGPT也出現(xiàn)過將三星機(jī)密資料外泄嚴(yán)重事件。開源閉源各有利弊，“兩條腿走路”才是目前大部分公司的選擇，即構(gòu)建一系列AI模型，既有閉源也要開源。

比如微軟130億元投資了OpenAI，但也擴(kuò)大了開源ONNX Runtime投資力度，以及下場推出開源Phi大模型；谷歌也是從過去押注堅持閉源，在今年2月突然推出“開源”大模型 Gemma，雙線作戰(zhàn)去對抗OpenAI和Llama。

在國內(nèi)，兼顧開源閉源的大模型更多。比如阿里通義千問，雖然以開源為主，但也有閉源模型，去年12月進(jìn)階至2.1版。包括百度也是如此，去年發(fā)布的文心千帆大模型平臺2.0，就接入了30多個主流大模型，包括Llama2等諸多開源大模型。

可以說，沒有開源大模型，就沒有如今百度智能云生態(tài)的成熟，在千行百業(yè)的落地——根據(jù)最新數(shù)據(jù)，文心千帆大模型生態(tài)伙伴數(shù)量過去半年增長 5 倍，API 調(diào)用量指數(shù)級增長，超8.5萬客戶，300多款進(jìn)入千帆應(yīng)用市場。對這些用戶和開發(fā)者而言，表面是在文心一言上，實(shí)際用到的也很可能是Llama2等開源模型。

既然如此，李彥宏為何還會多次斷言，開源大模型會一直落后？

有業(yè)內(nèi)人士就認(rèn)為，這或許與百度當(dāng)下大模型的戰(zhàn)略定位，以及需要為產(chǎn)品工具宣傳背書直接相關(guān)。

“以后人人都是開發(fā)者。”Create 大會上，李彥宏給出AI時代答案的同時，也發(fā)布了被廣泛宣傳的三大AI“開發(fā)神器”——AgentBuilder、AppBuilder、ModelBuilder，將個人、企業(yè)、開發(fā)者統(tǒng)統(tǒng)囊括在百度體系內(nèi)，加速搶占應(yīng)用入口，甚至是基礎(chǔ)模型通吃AI，構(gòu)建國內(nèi)最強(qiáng)大大模型生態(tài)的“野心”。

“如果說開源大模型開放且正逐漸強(qiáng)大，那么有多少人還愿意給閉源大模型送錢，甚至是加入受控制的生態(tài)體系？”一位網(wǎng)友評論說，長期以來，全球開發(fā)者對蘋果iOS封閉生態(tài)系統(tǒng)的“霸道”行為，深感不滿卻又無可奈何。

利用大模型賺錢，百度跑在前面

實(shí)際上，在大模型下半場，探索商業(yè)化路徑成為所有玩家亟待選擇的問題。

在這方面，李彥宏相當(dāng)坦誠，表示百度之所以堅持閉源，是因為市場有足夠多的開源，百度要開源還得自己去維護(hù)一套開源版本，從成本來說非常不劃算。更重要的是，閉源有著真正的商業(yè)模式，能夠賺到錢。

大模型當(dāng)前如何商業(yè)化，或者說賺錢？盡管各大模型還在探索ToB還是ToC的不同路徑，但重點(diǎn)布局方向都是“脫虛向?qū)?rdquo;，向“應(yīng)用為王”傾斜。

這一點(diǎn)，從李彥宏、周鴻祎或者其他行業(yè)大佬、專家表態(tài)來看，已成共識。

大模型商業(yè)化如何變現(xiàn)答案上，“all in”姿態(tài)的百度堪稱行業(yè)樣本，在國內(nèi)跑在最前面。

B端，構(gòu)建“文心千帆”一系列商業(yè)化矩陣，為客戶產(chǎn)品嫁接文心大模型能力，通過調(diào)用API調(diào)取實(shí)現(xiàn)營收。

這種收費(fèi)方式可以簡單理解為，模型租賃。360、阿里通義千問、騰訊混元、科大訊飛星火等通用大模型，以及更多行業(yè)大模型也有類似嘗試，但當(dāng)前大模型工具推動千行百業(yè)生產(chǎn)力進(jìn)步還需要過程，且門檻更高（如針對各行各業(yè)的定制化服務(wù)），基于tokens（“字”或“詞”）計價方式的ROI（投入產(chǎn)出比）各家并不算高，更多是通過API的綁定，向客戶出售云、廣告等其他服務(wù)。

李彥宏曾在2023年財報會中披露，去年Q4百度智能云總營收84億元，其中大模型為云業(yè)務(wù)帶來約6.6億元增量收入，同時文心大模型重構(gòu)后的廣告系統(tǒng)，為百度帶來數(shù)億元增量收入。根據(jù)李彥宏的預(yù)計，上述兩項增量收入，將在2024年增加到數(shù)十億。或許，這會成為百度智能云加快追趕阿里云、華為云等的希望。

更值得一提的是C端。在國外，ChatGPT率先推出收費(fèi)Plus服務(wù)；在國內(nèi)，百度緊隨其后，率先在C端推出了“文心一言”會員訂閱模式。

目前，文心一言3.5基礎(chǔ)版仍可免費(fèi)使用，只是體驗并不完美。能力更強(qiáng)的4.0則需要升級成會員，會員服務(wù)有兩種，分別是單獨(dú)的會員服務(wù)和聯(lián)合會員服務(wù)。

單獨(dú)會員服務(wù)價格上，連續(xù)包月優(yōu)惠價為49.9元，單月購買價格為59.9元，連續(xù)包年588.8元，12個月658.8元。選擇這種會員服務(wù)，用戶將能夠體驗文心大模型4.0的高級服務(wù)，比如更強(qiáng)的模型能力和圖片生成能力。

此外，百度還推出了文心一言4.0與文心一格白銀的聯(lián)合會員服務(wù)，限時特惠價為99元/月。除文心大模型4.0服務(wù)外，用戶還可以獲得文心一格白銀會員的權(quán)益，包括極速生成多尺寸高清圖像、創(chuàng)作海報和藝術(shù)字，以及AI編輯改圖修圖等功能。

不過，這也引起了部分用戶的爭議。雖然會員付費(fèi)是互聯(lián)網(wǎng)行業(yè)常見盈利模式，但像大模型會員這么貴價格的比較少見，比如鬧得沸沸揚(yáng)揚(yáng)的愛奇藝，多次漲價后會員包月價目前為每月25元。

如此貴的會員費(fèi)，業(yè)內(nèi)人士認(rèn)為大部分是AI 知識工作者、開發(fā)者等買單，從普通用戶角度看，如果一年用不上幾次，購買并不合適。

但客觀來看，如今生成式AI產(chǎn)品收費(fèi)是大勢所趨，且大模型會員價格貴，和服務(wù)器、芯片、訓(xùn)練、電費(fèi)等高額成本有關(guān)，如果不收費(fèi)，以百度的彈藥儲備，恐怕也難以支撐燒錢多久。

從財報來看，大模型C端會員收費(fèi)并未在百度最新財報中有所體現(xiàn)，有多少用戶付費(fèi)難以得知。但無論是B端還是C端的AI故事，想真正體現(xiàn)更大提振效應(yīng)，還需要很長的路要走。2023年百度總營收1345.98億元，在線營銷貢獻(xiàn)751億元的收入。

這不只是百度的問題。目前能從AI身上賺到錢的公司并不多，百度已經(jīng)算是其中佼佼者，一是迅速推動旗下大部分產(chǎn)品和大模型的融合，二是文心一言、百度廣告、智能云、自動駕駛等領(lǐng)域，都開始有了來自AI的落地收入，AI商業(yè)化布局呈多元化態(tài)勢。

OpenAI成功，首先是商業(yè)模式的成功。2022年全年，OpenAI收入僅為2800萬美元。今年2月有外媒稱，OpenAI的年化收入已超過20億美元，其估值達(dá)驚人的1000億美元。一些OpenAI的領(lǐng)導(dǎo)認(rèn)為，到2024年年底，該公司年化收入可以達(dá)到50億美元。

在商言商，只要未被利益蒙蔽雙眼，因商業(yè)利益而為自家產(chǎn)品、技術(shù)路線強(qiáng)硬站臺，無可厚非。

對李彥宏和他的百度來說顯然也是如此，其既不是發(fā)布會上鼓吹的“讓人人都是開發(fā)者”的那樣高尚，也不是周鴻祎反駁中的“胡說八道和忽悠”。區(qū)別，在于企業(yè)路線，在于未來策略。包括馬斯克和OpenAI 的決裂，本質(zhì)同樣如此。

當(dāng)然周鴻祎有一點(diǎn)沒有說錯，那就是OpenAI、文心一言也是自開源成長起來——如今所有主流大模型的核心機(jī)制（包括開源、閉源），都是基于Transformer架構(gòu)，熱潮起點(diǎn)則源自2017年的谷歌，其發(fā)表了《Attention is all you need》的經(jīng)典論文，對Transformer模型做出了具有歷史意義的重大改進(jìn)，有了Transformer框架下的“不可能三角”（并行訓(xùn)練能力、性能和低成本推理），才有了后來的GPT。

從這個角度看，AI和大模型注定引領(lǐng)一場新工業(yè)革命的當(dāng)下，斷言某一種技術(shù)路線會一直落后，也是一種極端。

END

出品人：黃槍槍

原文標(biāo)題 : 李彥宏不寒磣：不賺錢，做大模型干嗎？