訂閱
糾錯(cuò)
加入自媒體

不甘只做AI 應(yīng)用工廠,字節(jié)跳動(dòng)補(bǔ)課大模型

文|郝    鑫

編|王一粟

光錐智能獲取最新獨(dú)家消息,繼2023年8月首發(fā)后,今年4月,字節(jié)跳動(dòng)旗下的大語(yǔ)言模型云雀大模型即將迎來(lái)重要版本的升級(jí)更新。

八個(gè)月一次的更新頻率放在大模型市場(chǎng)確實(shí)少見(jiàn),在這樣內(nèi)卷的大模型中,字節(jié)顯得有些另類(lèi),沖刺迅猛如百川智能,前期平均一個(gè)月發(fā)布升級(jí)一款大模型。

但回顧過(guò)去一年,字節(jié)并不甘愿躺平,與國(guó)內(nèi)外大模型公司“先通用大模型,后產(chǎn)品應(yīng)用”的思路不同,素有“應(yīng)用工廠”的字節(jié)選擇在有一個(gè)云雀大模型的基礎(chǔ)上,狠、準(zhǔn)、快地押注AI原生應(yīng)用。

先是從組織層面著手,2023年下半年,字節(jié)開(kāi)始整合大模型團(tuán)隊(duì)和其他業(yè)務(wù)小組,成立專(zhuān)注于AI創(chuàng)新業(yè)務(wù)的新部門(mén)Flow,部門(mén)也成為字節(jié)在AI技術(shù)研究和研發(fā)產(chǎn)品的排頭兵。

再是像一架龐大制造機(jī)器,半年多的時(shí)間里,字節(jié)瘋狂地向國(guó)內(nèi)外市場(chǎng)輸送了十幾款A(yù)I產(chǎn)品;與此同時(shí),也在產(chǎn)品研發(fā)過(guò)程中積累和發(fā)表了一批圖像生成、視頻生成的基礎(chǔ)技術(shù)研究成果。

如今,字節(jié)就像是在產(chǎn)品和市場(chǎng)領(lǐng)域摸爬滾打完一圈后回來(lái),帶著更多元化的視角來(lái)審視基礎(chǔ)大模型本身。

作為互聯(lián)網(wǎng)新貴,字節(jié)沒(méi)有經(jīng)歷過(guò)2016年興起的大廠AI實(shí)驗(yàn)室浪潮,反而是用AI算法技術(shù)和圖文、視頻結(jié)合,相繼創(chuàng)造出了今日頭條和抖音的爆款應(yīng)用。

據(jù)最新披露,字節(jié)2023年Q3營(yíng)收309億美元,已經(jīng)超過(guò)了騰訊。新王登基后,擺在字節(jié)面前的問(wèn)題也很清晰,如何利用自己的優(yōu)勢(shì)補(bǔ)齊落下的課,趕上新一波的AI浪潮?

AI應(yīng)用制造工廠,半年上線十一款產(chǎn)品

“加強(qiáng)危機(jī)感,始終創(chuàng)業(yè),逃逸平庸的重力”,2024年伊始,字節(jié)CEO梁汝波就定下了全年的目標(biāo)。

要說(shuō)最貼合梁汝波所說(shuō)的創(chuàng)業(yè)屬性的,莫過(guò)于字節(jié)去年成立的Flow。

去年8月云雀大模型正式發(fā)布,并同時(shí)宣布開(kāi)始對(duì)外測(cè)試AI對(duì)話產(chǎn)品“豆包”,字節(jié)立即奔赴至下一個(gè)應(yīng)用的戰(zhàn)場(chǎng),云雀大模型逐漸隱去在了鋪天蓋地的消息中,轉(zhuǎn)而成為了豆包等一系列AI產(chǎn)品背后的“底座”。

九月份,字節(jié)新成立的Flow接棒成為主力。據(jù)公開(kāi)報(bào)道信息梳理,字節(jié)抽調(diào)了大量高管人才掌舵,大模型團(tuán)隊(duì)的負(fù)責(zé)人朱文佳同時(shí)負(fù)責(zé)Flow的業(yè)務(wù)線,字節(jié)技術(shù)副總裁洪定坤負(fù)責(zé)Flow的技術(shù)線,字節(jié)產(chǎn)品與戰(zhàn)略副總裁朱駿負(fù)責(zé)該部門(mén)的產(chǎn)品線,同時(shí)還有飛書(shū)的產(chǎn)品副總裁齊元俊加盟。

(光錐智能根據(jù)公開(kāi)報(bào)道梳理制成)

在字節(jié)大舉進(jìn)軍之下,實(shí)現(xiàn)了多個(gè)應(yīng)用,多點(diǎn)開(kāi)花的局面。據(jù)光錐智能不完全統(tǒng)計(jì),從去年八月到現(xiàn)在,半年多的時(shí)間內(nèi),字節(jié)在海內(nèi)外共測(cè)試、上線了十一款A(yù)I應(yīng)用產(chǎn)品,一款圖像類(lèi)的產(chǎn)品Picpic還未上線,這其中由Flow團(tuán)隊(duì)主導(dǎo)研發(fā)的產(chǎn)品有八款。

從產(chǎn)品類(lèi)型來(lái)看,字節(jié)選擇的方向主要集中在Chatbot、虛擬角色、Agent和圖像四個(gè)主要方向,基本覆蓋了去年大火的應(yīng)用層創(chuàng)業(yè)方向,比如Chatbot領(lǐng)域有一騎絕塵的效率產(chǎn)品 ChatGPT,虛擬角色領(lǐng)域有用戶(hù)數(shù)量可觀的Character.AI,Agent方向上有OpenAI推出的GPTs等等。

多個(gè)方向出擊,遍地開(kāi)花,這樣的畫(huà)面仿佛一夜又回到了抖音誕生的前夕。入局AI應(yīng)用賽道,字節(jié)再次采用了“內(nèi)部賽馬”的策略,國(guó)內(nèi)通過(guò)云雀大模型提供能力,國(guó)外基于GPT提供服務(wù)。很多時(shí)候把海外當(dāng)試驗(yàn)田,先國(guó)內(nèi)一步上線類(lèi)似的產(chǎn)品,去跑市場(chǎng)和用戶(hù)數(shù)據(jù),為國(guó)內(nèi)上線作準(zhǔn)備。

此外,字節(jié)也很清楚自身的優(yōu)勢(shì)在哪里,抖音和Tiktok兩個(gè)流量大池,天然成為了字節(jié)引流和拉新的利器。據(jù)光錐智能觀察,字節(jié)專(zhuān)門(mén)開(kāi)設(shè)了豆包的“帶貨直播間”,向進(jìn)入直播間的用戶(hù)介紹豆包的功能,宣傳可免費(fèi)下載App。此外,字節(jié)也邀請(qǐng)了大量的抖音達(dá)人為豆包站臺(tái),在段子里植入了豆包的新功能。

(圖源:抖音)

或許正是因?yàn)榱髁康臓恳,發(fā)布時(shí)間晚的豆包在認(rèn)知度和月活上已經(jīng)超過(guò)了百度的文心一言。據(jù)報(bào)道,有消息人士透露豆包的月活已于去年12月增長(zhǎng)至200萬(wàn),2024年1月份則在此基礎(chǔ)上翻了一番,豆包的月內(nèi)平均日活已經(jīng)完成了對(duì)文心一言的反超。

從字節(jié)自身業(yè)務(wù)角度來(lái)看,除了Flow,飛書(shū)、剪映、字節(jié)新加坡公司、巨量引擎、大力教育等多個(gè)部分也在試水和上線AI工具和產(chǎn)品。自從Sora問(wèn)世以后,AI視頻賽道再燃戰(zhàn)火,字節(jié)的剪映業(yè)務(wù)也被寄與了厚望,張楠辭任抖音集團(tuán)CEO一職領(lǐng)隊(duì)剪映團(tuán)隊(duì),從目前來(lái)看,剪映已經(jīng)上線了 AI 克隆音色、AI 作圖、AI 繪畫(huà)、AI 生成口播等功能。

(圖源:剪映)

字節(jié)在 AI 視頻上推出產(chǎn)品也許只是早晚的事情,在技術(shù)儲(chǔ)備方面,字節(jié)已經(jīng)積累了視頻生成模型MagicVideo-V2、視頻編輯Boximator、視頻生成研究 PixelDance,并從谷歌視頻生成模型團(tuán)隊(duì)挖過(guò)來(lái)了對(duì)口人才。

已有消息稱(chēng),字節(jié)正在AI大模型領(lǐng)域秘密研發(fā)多個(gè)產(chǎn)品,其中包括多模態(tài)數(shù)字人產(chǎn)品以及AI生圖、AI生視頻產(chǎn)品。

字節(jié)不急于改舊業(yè)務(wù),而利用單點(diǎn)的能力放射去內(nèi)部賽馬,一方面是為了測(cè)試市場(chǎng),一方面也在探索如何把AI嵌入到原有的業(yè)務(wù)流中。

比如在飛書(shū)業(yè)務(wù)線中推出了“智能伙伴”,用Agent的技術(shù)來(lái)改變傳統(tǒng)的工作流,實(shí)現(xiàn)辦公場(chǎng)景下的內(nèi)容創(chuàng)作、內(nèi)容總結(jié)、數(shù)據(jù)分析等功能,達(dá)到個(gè)人和企業(yè)的降本增效。哪些地方要發(fā)揮 Agent的能力,哪些地方要運(yùn)用文生圖的能力,哪些場(chǎng)景要調(diào)用對(duì)話推理的能力,這些都要在落地過(guò)程中去檢驗(yàn)。

飛書(shū)CEO謝欣曾在發(fā)布會(huì)上表示,未來(lái)AI的能力一定會(huì)變得非常強(qiáng)大,各行各業(yè)都會(huì)發(fā)生巨大變革。但目前AI能力還很有限,不一定能讓每一項(xiàng)任務(wù)都如期所愿,“當(dāng)下更重要的是先讓自己做到AI Ready”。

重回主戰(zhàn)場(chǎng),補(bǔ)課大模型

梁汝波在2023年底年會(huì)上反思,“字節(jié)對(duì)技術(shù)的敏感度不如創(chuàng)業(yè)公司,直到2023年才開(kāi)始討論GPT。而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司,都是在2018年至2021年創(chuàng)立的。”

梁汝波的言外之意是,字節(jié)的大模型慢了。

去年3月百度發(fā)布文心一言,隨后華為、阿里迅速跟進(jìn)發(fā)布大模型,而直到8月中旬,抖音云雀大模型才姍姍來(lái)遲。

關(guān)于字節(jié)大模型團(tuán)隊(duì)消息,最早可追溯至去年1月份,36氪曾報(bào)道,字節(jié)在當(dāng)時(shí)組建了首個(gè)大模型團(tuán)隊(duì),包括語(yǔ)言大模型團(tuán)隊(duì)和圖片大模型團(tuán)隊(duì)。其中,語(yǔ)言大模型團(tuán)隊(duì)由字節(jié)搜索部門(mén)牽頭,圖片大模型團(tuán)隊(duì)由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭。

彼時(shí),ChatGPT和Midjourney都已經(jīng)爆火出圈。或許是看到了這兩類(lèi)背后路徑不同的產(chǎn)品,再考慮到旗下的一系列產(chǎn)品如何改造,字節(jié)從最初組建團(tuán)隊(duì),就選擇了技術(shù)、產(chǎn)品兩條腿走路。但大模型是大部分AI應(yīng)用的底座,想要研發(fā)產(chǎn)品首先得有一個(gè)大模型。

云雀大模型正好承擔(dān)了這樣的角色,大模型剛一落地,字節(jié)就迅速同時(shí)開(kāi)啟了AI應(yīng)用研發(fā),但大模型性能上的不成熟,也一定程度上影響了AI應(yīng)用的落地。

首先是從時(shí)間線上來(lái)看,相同功能的產(chǎn)品,國(guó)外上線的時(shí)間要早于國(guó)內(nèi),比如類(lèi)GPTs平臺(tái)扣子國(guó)內(nèi)開(kāi)放時(shí)間比國(guó)外滯后了兩個(gè)月。即便國(guó)內(nèi)的扣子上線后,但還是有很多中國(guó)用戶(hù)選擇國(guó)外版的Coze,原因在于可以直接調(diào)用 GPT-4 turbo的能力。

模型能力的高低之分,也會(huì)體現(xiàn)在產(chǎn)品的使用效果上,比如近期剪映海外版CapCut也推出了文生成視頻功能,但有用戶(hù)反饋,該功能在視頻清晰度、對(duì)提示詞理解和生成等待時(shí)間方面都差強(qiáng)人意。

這就導(dǎo)致了,在產(chǎn)品戰(zhàn)場(chǎng)大殺四方的字節(jié),不得不回過(guò)頭來(lái)補(bǔ)課大模型。

不過(guò)對(duì)字節(jié)而言,對(duì)標(biāo)OpenAI 沒(méi)有太大意義,思考適合自己的大模型路線才是出路。

從公開(kāi)資料來(lái)看,字節(jié)在AI方向的發(fā)力點(diǎn)還是集中在圖像、視頻領(lǐng)域。大模型方面,字節(jié)目前推出了通用大語(yǔ)言模型云雀和支持文本、圖像、音頻三種模態(tài)的多模態(tài)大模型BuboGPT;圖像視覺(jué)方向上,去年推出的MagicVideo-V2視頻生成模型曾經(jīng)在國(guó)內(nèi)外掀起了一波熱度,可以實(shí)現(xiàn)讓靜態(tài)圖片中的人物動(dòng)起來(lái)。字節(jié)之后的研究繼續(xù)在視頻方向上延伸,包括如何通過(guò)輸入文本控制人物動(dòng)作,如何增進(jìn)視頻的動(dòng)態(tài)效果等。

(光錐智能根據(jù)公開(kāi)報(bào)道梳理制成)

由此看來(lái),字節(jié)還是借鑒了OpenAI的做法,也就是在GPT大模型之外,把各種單點(diǎn)能力拉到最滿(mǎn)——語(yǔ)音方向有Whisper模型,圖像方向有DALL·E系列,視頻方向有Sora。

由于單點(diǎn)能力的突破也依賴(lài)于底層大模型的能力,特別是Sora提供了一種思路,即Transformer大模型架構(gòu)可以與圖像生成模型相結(jié)合,這意味著大模型的推理、理解能力會(huì)影響最后的視頻生成邏輯。所以,在基礎(chǔ)大模型上,包括字節(jié)在內(nèi)的所有大模型公司,都依然不能忽視。

除了在視頻模型上補(bǔ)足能力,字節(jié)也從團(tuán)隊(duì)人才配置上下足了功夫。組建初期,抽調(diào)原新加坡負(fù)責(zé)TikTok技術(shù)負(fù)責(zé)人朱文佳帶領(lǐng)大模型團(tuán)隊(duì),后又令其同時(shí)負(fù)責(zé)Flow的業(yè)務(wù)線。一個(gè)排頭兵性質(zhì)的部門(mén)Flow,集結(jié)了字節(jié)的技術(shù)副總裁、產(chǎn)品與戰(zhàn)略副總裁、飛書(shū)產(chǎn)品副總裁。近期,又被曝出谷歌視頻生成模型VideoPoet研究負(fù)責(zé)人蔣路加入了智能創(chuàng)作團(tuán)隊(duì),據(jù)悉,VideoPoet的思路與Sora世界模型的思路有很大的相似性。

Sora爆火后,有不少人將抖音前CEO張楠親自帶隊(duì)的剪映與其相提并論,但實(shí)際上,張楠仍然是更側(cè)重于產(chǎn)品層面。而真正的字節(jié)版Sora,必須要在上述這些科學(xué)家和技術(shù)負(fù)責(zé)人帶隊(duì)的團(tuán)隊(duì)中誕生。

廣告&云業(yè)務(wù)

AI對(duì)字節(jié)的影響比想象中更大

去年一年,字節(jié)跳動(dòng)創(chuàng)始人張一鳴將主要精力都花在了AI上,這對(duì)于受益于上一代AI技術(shù)(推薦算法)的最大受益者來(lái)說(shuō),的確具有不同凡響的重要意義。

AIGC最終生成的是內(nèi)容,天然就是對(duì)內(nèi)容生產(chǎn)形式的變革。相對(duì)于其他公司原有的電商、搜索、社交等業(yè)務(wù)屬性,抖音的基因本身就是內(nèi)容,因此,這波大模型浪潮對(duì)字節(jié)的戰(zhàn)略意義,可能會(huì)遠(yuǎn)大于其他公司。

雖然,ChatGPT-4 誕生剛滿(mǎn)一年,大模型和 AIGC 技術(shù)落地產(chǎn)業(yè)僅邁出了第一步,但是關(guān)于未來(lái)公司業(yè)務(wù)增長(zhǎng)的想象力或許才剛打開(kāi)。

以百度為例,其剛發(fā)布的2023年全年財(cái)報(bào)數(shù)據(jù)顯示,AI 已經(jīng)給百度帶來(lái)了實(shí)際的效益。All in 大模型的這一年,讓百度搜索、廣告等老業(yè)務(wù)煥發(fā)生機(jī),曾經(jīng)低迷的云計(jì)算業(yè)務(wù)也看到了新的增長(zhǎng)動(dòng)力。

2023年百度核心收入1034.65億元,歸屬百度核心的凈利潤(rùn)274億元,同比增長(zhǎng)38%;大模型正在給百度帶來(lái)越來(lái)越多的商業(yè)收入,四季度內(nèi),僅大模型帶來(lái)的收入增長(zhǎng)就達(dá)到了6.6億元,百度智能云的營(yíng)收也來(lái)到了84億元;根據(jù)摩根士丹利的預(yù)估,2024年百度的廣告收入有望實(shí)現(xiàn)7%的同比增長(zhǎng)。

雖然對(duì)字節(jié)來(lái)說(shuō),這點(diǎn)增長(zhǎng)遠(yuǎn)遠(yuǎn)納入不了自己的眼睛,但不少業(yè)務(wù)線也依然具有一定的借鑒和參考價(jià)值。

據(jù)光錐智能了解到,受大模型浪潮影響,字節(jié)的云計(jì)算業(yè)務(wù)火山引擎的營(yíng)收增長(zhǎng)也比較可觀。得益于字節(jié)前期儲(chǔ)備了大量英偉達(dá)的GPU,很多大模型創(chuàng)業(yè)公司都愿意主動(dòng)加入到火山引擎的生態(tài)中,從而拉動(dòng)了火山引擎的增長(zhǎng)。

雖然第一波先靠賣(mài)算力賺到第一桶金,但對(duì)火山引擎來(lái)說(shuō),未來(lái)靠使用這些大模型公司的算法而再次為云計(jì)算業(yè)務(wù)付費(fèi)的客戶(hù),才是更吸引人的。

而對(duì)字節(jié)賴(lài)以生存的廣告業(yè)務(wù)而言,大模型的影響力還尚未施展。目前,已經(jīng)有百度、網(wǎng)易有道在內(nèi)的幾家公司都提到,大模型對(duì)其廣告轉(zhuǎn)化都有促進(jìn)作用。這對(duì)抖音、今日頭條等業(yè)務(wù),無(wú)疑也是一個(gè)好消息。

為了提升營(yíng)銷(xiāo)效率,抖音旗下的營(yíng)銷(xiāo)平臺(tái)巨量引擎,也在1月23日,發(fā)布自動(dòng)化技術(shù)品牌 UBMax(優(yōu)必投),立足應(yīng)用下載、線索留資、電商引流三個(gè)場(chǎng)景。

另外,火山引擎也推出了非常具有字節(jié)特色的產(chǎn)品——火山引擎智能創(chuàng)作云,這是一個(gè)批量生成視頻的智能SaaS平臺(tái),主要幫助電商賣(mài)家批量生成商品素材。雖然目前市場(chǎng)上做此類(lèi)產(chǎn)品的公司非常多,也有一些是抖音的深度合作伙伴,但對(duì)于同時(shí)擁有技術(shù)和場(chǎng)景的公司,也只能是字節(jié)才能做到。

綜上所述,總體來(lái)看,字節(jié)在AI的投入上還是趨于保守,更注重對(duì)實(shí)際業(yè)務(wù)能產(chǎn)生價(jià)值的產(chǎn)品,而對(duì)前沿技術(shù)的投入才剛剛起步。

這也和字節(jié)近一年的聚焦戰(zhàn)略有關(guān),近一年,字節(jié)幾乎清退或削減了所有與核心業(yè)務(wù)無(wú)關(guān)的業(yè)務(wù)條線,比如Pico、游戲。

核心業(yè)務(wù)強(qiáng)勢(shì)的時(shí)候,發(fā)展可以掩蓋一切問(wèn)題。字節(jié)季度營(yíng)收依然可以保持40%以上的同比增長(zhǎng),已經(jīng)羨煞其他所有國(guó)內(nèi)公司,但對(duì)字節(jié)和張一鳴來(lái)說(shuō),夢(mèng)想還是要有的。

       原文標(biāo)題 : 不甘只做AI 應(yīng)用工廠,字節(jié)跳動(dòng)補(bǔ)課大模型

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)