打完“價(jià)格戰(zhàn)”,大模型還要比什么
來源 | 伯虎財(cái)經(jīng)(bohuFN)
作者 | 楷楷
在近日舉辦的2024年云棲大會(huì)上,阿里再次成為了焦點(diǎn)。
今年5月,阿里云宣布旗下通義千問的多款商業(yè)化及開源模型進(jìn)行大幅降價(jià),最高降價(jià)幅度高達(dá)97%;云棲大會(huì)上,通義千問三款主力模型再次大幅降價(jià),最高降幅達(dá)85%。
自阿里在5月率先“開卷”之后,字節(jié)跳動(dòng)旗下云服務(wù)火山引擎、百度智能云、騰訊云、科大訊飛等均官宣旗下大模型大幅下調(diào)價(jià)格,行業(yè)降價(jià)幅度達(dá)到了90%左右。
不僅國內(nèi)大模型廠商跟進(jìn)價(jià)格戰(zhàn),行業(yè)風(fēng)向標(biāo) OpenAI 也在今年7月推出了GPT-4o mini ,商用價(jià)格較GPT-3.5 Turbo 便宜了60% 以上。
可以預(yù)見,在阿里再掀“價(jià)格戰(zhàn)”之后,大模型價(jià)格還將繼續(xù)下調(diào),甚至可能走向“負(fù)毛利”。在互聯(lián)網(wǎng)行業(yè)的發(fā)展史中,“虧本換規(guī)!辈⒉皇悄硞(gè)企業(yè)的孤例,要改變整個(gè)行業(yè)的商業(yè)模式,必然需要投入更高的成本。
但在這個(gè)過程中,如何平衡價(jià)格、質(zhì)量與服務(wù)也成為了大模型企業(yè)必須思考的問題,企業(yè)想要“活下來”,就不能只吃“低垂的果實(shí)”。
01 規(guī)模比利潤更重要
國內(nèi)大模型已從“以分計(jì)價(jià)”的定價(jià)模式走向“以厘計(jì)價(jià)”的新時(shí)代。今年5月,阿里通義千問大模型的API調(diào)用輸出價(jià)格,從0.02元/千Tokens降至0.0005元/千Tokens。
在9月再次降價(jià)之后,阿里云Qwen-Turbo(128k)、Qwen-Plus(128k)、Qwen-Max 三款模型每千 tokens的最低調(diào)用價(jià)格再次刷新下限,分別降至0.0003元、0.0008元、0.02元。
對于再次降價(jià),阿里云CTO周靖人表示,每一次降價(jià)都是一個(gè)非常嚴(yán)肅的過程,要從整個(gè)產(chǎn)業(yè)發(fā)展,開發(fā)者、企業(yè)用戶的反饋等各方面進(jìn)行權(quán)衡,(降價(jià))不是“價(jià)格戰(zhàn)”,(大模型價(jià)格)還是太貴了。
隨著一個(gè)行業(yè)的成熟發(fā)展,其走向降價(jià)趨勢也是必然的,比如半導(dǎo)體行業(yè)的“摩爾定律”,即處理器的性能大約每兩年翻一倍,但工藝的進(jìn)步會(huì)使成本下降為之前的一半。
但目前來看,大模型行業(yè)的降價(jià)速度已經(jīng)遠(yuǎn)超“摩爾定律”,降價(jià)幅度接近100%,在這樣的背景下,大模型企業(yè)還能盈利嗎?或許對大模型行業(yè)來說,當(dāng)前規(guī)模比利潤更重要。
一方面,暫時(shí)讓渡利潤已是大模型行業(yè)的共識,業(yè)內(nèi)人士認(rèn)為,大模型行業(yè)甚至可能已經(jīng)到了“負(fù)毛利時(shí)代”。
據(jù)《財(cái)經(jīng)》雜志報(bào)道,阿里云、百度智能云等多位負(fù)責(zé)人曾透露,今年5月以前,國內(nèi)大模型推理算力毛利率高于60%,和國際同行基本一致,但在5月接連降價(jià)后,毛利率則跌至負(fù)數(shù)。
在大模型降價(jià)以后,使用者數(shù)量會(huì)持續(xù)增多,短期內(nèi)調(diào)用次數(shù)越多,大模型的虧損就越大,因?yàn)槊看握{(diào)用模型都要消耗價(jià)格不菲的算力,也就是說大模型企業(yè)不僅要降低售價(jià),還要面臨更高的成本投入。
但另一方面,大模型降價(jià)帶來的效果也是顯著的。以阿里云為例,在大模型降價(jià)以后,阿里云百煉平臺(tái)的付費(fèi)客戶數(shù)比上一個(gè)季度增長了超過200%,更多企業(yè)放棄私有化部署,選擇在百煉上調(diào)用各類AI大模型,目前百煉已服務(wù)超30萬個(gè)客戶。
過去一年,百度文心大模型的降價(jià)幅度也超過90%,不過,百度在2024年Q2財(cái)報(bào)電話會(huì)上披露,文心大模型日均調(diào)用量超6億次,半年內(nèi)增長超10倍。
如此看來,大模型企業(yè)寧愿犧牲利潤也要降價(jià),所求的正是“預(yù)期”,即犧牲短期利益來換取長期回報(bào)。
有業(yè)內(nèi)人士估計(jì),目前各家大模型企業(yè)在模型調(diào)用領(lǐng)域的收入不會(huì)超過10億元,相較于百億元級別的總營收,這筆收入只是“九牛一毛”。
但在未來1-2年,大模型調(diào)用次數(shù)至少有10倍以上的指數(shù)級增長,短期來看,用戶規(guī)模越大,大模型的算力成本越高;但長期來看,在云服務(wù)領(lǐng)域,算力成本有望隨著客戶需求增長逐漸攤薄,企業(yè)將會(huì)迎來“回報(bào)期”。
隨著行業(yè)的持續(xù)發(fā)展,AI對算力的拉動(dòng)會(huì)越來越明顯,阿里CEO吳泳銘曾表示,在算力市場上,超過50%的新需求都是由AI驅(qū)動(dòng)產(chǎn)生的,大模型正在加速商業(yè)化。
一方面,降價(jià)大大降低了企業(yè)客戶的使用門檻和試錯(cuò)成本,特別是對政務(wù)、制造、能源等傳統(tǒng)行業(yè)來說,它們的業(yè)務(wù)規(guī)模更大,增量空間也更大。
當(dāng)大模型能夠像其他基礎(chǔ)設(shè)施一樣人人可用時(shí),大模型的市場空間才能有望實(shí)現(xiàn)大幅增長,在這之前,大模型企業(yè)難免需要讓利給企業(yè)和開發(fā)者。
另一方面,大模型降價(jià)后存量收入會(huì)下降,但增量收入會(huì)增長。以百度為例,大模型不僅帶來了直接收入,比如文心大模型等產(chǎn)品的調(diào)用等,還能帶動(dòng)間接業(yè)務(wù)的收入,比如百度智能云業(yè)務(wù)。
過去幾年,外界對百度智能云戰(zhàn)略不乏質(zhì)疑,其在公有云市場并不占優(yōu)勢,但在AI公有云這個(gè)細(xì)分市場,百度開始彎道超車。目前,百度智能云的大模型收入占比已從2023年四季度的4.8%提升到了2024年二季度的9%。
所以,目前大模型行業(yè)的共識,就是規(guī)模比利潤更重要,這一觀點(diǎn)在互聯(lián)網(wǎng)時(shí)代也是老生常談,比如“千團(tuán)大戰(zhàn)”“網(wǎng)約車大戰(zhàn)”“電商大戰(zhàn)”等。大模型企業(yè)不能回避“價(jià)格戰(zhàn)”,就只能將活過價(jià)格戰(zhàn)作為初步目標(biāo),希望能成為淘汰賽結(jié)束后的最終受益者。
02 阿里著力“AI大基建”
阿里也深知這一道理,其在近日宣布大模型再次降價(jià)后,也提出了“AI大基建”的概念。阿里云副總裁張啟表示,現(xiàn)在的AI相當(dāng)于1996年前后的互聯(lián)網(wǎng),當(dāng)時(shí)的上網(wǎng)資費(fèi)很貴,這也限制了移動(dòng)互聯(lián)網(wǎng)的發(fā)展,只有把資費(fèi)降下來,才有可能談未來的應(yīng)用爆發(fā)。
所以,阿里除了在2024年云棲大會(huì)上提出大模型再次降價(jià)之外,還發(fā)布了新一代的開源大模型,一口氣上架了100 多個(gè)模型,涵蓋多個(gè)尺寸的大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,創(chuàng)造了大模型開源的“數(shù)量之最”。
阿里云CTO周靖人表示,阿里云堅(jiān)定不移地推進(jìn)開源戰(zhàn)略,希望把選擇留給開發(fā)者,讓開發(fā)者會(huì)基于自己的業(yè)務(wù)場景去做模型能力增強(qiáng)和推理效率增強(qiáng)的權(quán)衡與選擇,同時(shí)也能更有效服務(wù)企業(yè)。
根據(jù)阿里的統(tǒng)計(jì),截至 2024 年 9 月中旬,通義千問開源模型下載量突破 4000 萬,Qwen 系列衍生模型總數(shù)超過 5 萬個(gè),成為僅次于 Llama 的世界級模型群,而Llama正是大模型開源界的“頭把交椅”,全球下載量接近3.5億。
在“百模大戰(zhàn)”結(jié)束之后,多位行業(yè)大佬均認(rèn)為“卷模型不如卷應(yīng)用”,大廠也開始聚焦“卷生態(tài)”。百度董事長李彥宏曾表示,“沒有構(gòu)建于基礎(chǔ)模型之上的、豐富的AI原生應(yīng)用生態(tài),大模型就一文不值!
目前,通過國家網(wǎng)信辦備案的大模型已達(dá)190多個(gè),注冊用戶超6億,但仍難以解決大模型“最后一公里”問題,難點(diǎn)不僅是大模型應(yīng)用太少,還有大模型不夠“接地氣”,比如在醫(yī)療、金融等專業(yè)領(lǐng)域中,單純依靠“喂數(shù)據(jù)”訓(xùn)練,大模型還是很難直接落地應(yīng)用。
大廠不可能躬身入局每一個(gè)細(xì)分行業(yè)來完成“最后一公里”,但可以通過打造完整的應(yīng)用生態(tài),由下游企業(yè)或其他開發(fā)者自行“煉成”符合需求的模型產(chǎn)品,不僅能進(jìn)一步優(yōu)化資源配置,也能在這個(gè)過程中積累更多高質(zhì)量數(shù)據(jù),最終反哺給基礎(chǔ)大模型開發(fā)。
阿里選擇降價(jià)、開源,本質(zhì)就是希望降低大模型的使用門檻,通過更低的價(jià)格來驗(yàn)證大模型的應(yīng)用價(jià)值,讓更多企業(yè)和創(chuàng)作者參與進(jìn)來。只有大模型能夠真正滿足企業(yè)的復(fù)雜業(yè)務(wù)場景需求,生態(tài)才能發(fā)展起來,行業(yè)才能進(jìn)入新的階段。
不過,“百模大戰(zhàn)”最終可能只會(huì)留下3-5家大模型企業(yè),目前來看,行業(yè)第一梯隊(duì)已經(jīng)呼之欲出,它們也可能會(huì)是大模型行業(yè)未來最基本的底座。
因此,頭部的大模型企業(yè)更不可能主動(dòng)放棄價(jià)格戰(zhàn),讓出自己的市場份額。除此以外,不少獨(dú)角獸也希望憑借價(jià)格戰(zhàn)殺出一條“生路”,部分企業(yè)也認(rèn)為小模型或更具性價(jià)比。
事實(shí)上,今年5月的大模型價(jià)格戰(zhàn)并非始于阿里,而是一條名為“DeepSeek V2”的鯰魚,在行業(yè)普遍推理價(jià)格還是百元/Tokens的背景下,其將支持32k上下文的模型API定價(jià)為1元/百萬Tokens(計(jì)算)、2元/百萬Tokens(推理)。
目前來看,大模型淘汰賽或還會(huì)持續(xù)2-3年,雖然最終留下的大模型企業(yè)并不會(huì)多,為了活下去,企業(yè)們也不得不使出渾身解數(shù),但問題是,當(dāng)“低垂的果實(shí)”都被摘完之后,當(dāng)下大模型行業(yè)的解題思路早已不是“便宜就完事”。
03 0模型能力仍是關(guān)鍵
不過,對于大模型“價(jià)格戰(zhàn)”一事,行業(yè)也有不同的看法。零一萬物創(chuàng)始人李開復(fù)曾表示,沒有必要打瘋狂的價(jià)格戰(zhàn),因?yàn)榇竽P筒还庖磧r(jià)格,還要看技術(shù),如果是技術(shù)不行,然后靠賠錢來做生意,(公司)不會(huì)對標(biāo)這樣的定價(jià)。
火山引擎總裁譚待在談及價(jià)格戰(zhàn)時(shí)也表示,當(dāng)前主要關(guān)注的是應(yīng)用覆蓋,而不是收入,要有更強(qiáng)的模型能力才能解鎖新場景,這才更有價(jià)值。
目前來看,“價(jià)格戰(zhàn)”的本質(zhì)還是因?yàn)楫a(chǎn)品能力不足,各家模型能力趨于同質(zhì)化,暫時(shí)無法形成斷檔的差距,所以才希望通過價(jià)格戰(zhàn)來增加大模型的普及,也能幫助廠商增加市場份額。
但等到市場摘完“低垂的果實(shí)”,新問題也會(huì)接踵而來,企業(yè)能否扛下下一階段的價(jià)格戰(zhàn);大模型能否和對手拉開差距;自己會(huì)否成為最終能夠留下來的企業(yè),這些問題依然需要解決。
所以,大模型企業(yè)在打價(jià)格戰(zhàn)的同時(shí),也深知產(chǎn)品、技術(shù)、現(xiàn)金流的重要性,既要抗住降價(jià)壓力,又要和對手拉開技術(shù)差距,持續(xù)提升模型性能和產(chǎn)品落地,才能形成良性的商業(yè)閉環(huán)。
一方面,大模型企業(yè)并非單純依賴“價(jià)格戰(zhàn)”。通常來說,大模型的推理包含時(shí)間、價(jià)格、生成 Token 數(shù)量三個(gè)變量,不能拋開單位時(shí)間內(nèi)的并發(fā)數(shù)量,只看 tokens 價(jià)格。
因?yàn)樵趯?shí)際跑業(yè)務(wù)的過程中,推理事件越復(fù)雜,越有可能要增加并發(fā)量。但目前降價(jià)大模型普遍使用的是預(yù)置模型(不支持增加并發(fā)量),真正大規(guī)模、高性能、支持高并發(fā)的模型推理均未有大幅降價(jià)。
另一方面,通過技術(shù)來進(jìn)一步優(yōu)化大模型的推理成本。以百度為例,旗下的百舸異構(gòu)計(jì)算平臺(tái)對智算集群的設(shè)計(jì)、調(diào)度、容錯(cuò)等環(huán)節(jié)進(jìn)行了專項(xiàng)優(yōu)化,能夠?qū)崿F(xiàn)萬卡集群上的模型有效訓(xùn)練時(shí)長占比超過98.8%,線性加速比、帶寬有效性分別高達(dá)95%,幫助客戶解決算力短缺和算力成本偏高等問題。
微軟CEO薩蒂亞·納德拉曾舉例表示,過去一年 GPT-4 性能提升了6倍,但成本降低到了之前的1/12,性能/成本提升了70倍。不難看出,大模型技術(shù)的發(fā)展才是行業(yè)持續(xù)降價(jià)的底氣。
最后,則是打造出更有差異化的產(chǎn)品。低價(jià)策略能夠幫助大模型企業(yè)筑造生態(tài),但隨著AI領(lǐng)域的不斷發(fā)展,創(chuàng)新速度的加快也使得技術(shù)更新?lián)Q代周期縮短,是否能夠持續(xù)提供有競爭力的產(chǎn)品,能否在實(shí)際應(yīng)用中解決用戶痛點(diǎn),才是大模型企業(yè)的核心競爭力。
目前,大模型行業(yè)的商業(yè)邏輯,已經(jīng)從卷模式、卷成本,邁入到卷生態(tài)、卷技術(shù)的新階段。當(dāng)然,低價(jià)還是快速建立生態(tài)壁壘的重要手段,但通過技術(shù)降低成本,才是推動(dòng)大模型快進(jìn)到“價(jià)值創(chuàng)造階段”的關(guān)鍵要素。
接下來,大模型企業(yè)的新戰(zhàn)場將會(huì)是“性價(jià)比”,要在當(dāng)前的價(jià)格基礎(chǔ)上,進(jìn)一步提高大模型的質(zhì)量和性能,讓模型能力更強(qiáng)、更多元,這么做或許不一定能孵化出“超級應(yīng)用”,但吸引更多中小企業(yè)、創(chuàng)業(yè)公司的加入,才有機(jī)會(huì)為大模型企業(yè)帶來爆發(fā)式增長的機(jī)會(huì)。
文章封面首圖及配圖,版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無償使用,請及時(shí)聯(lián)系我們,本平臺(tái)將立即更正。
原文標(biāo)題 : 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級軟件工程師 廣東省/深圳市
- 自動(dòng)化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市