永久黄色无码网站,女国产女AV百合大片在线观看

大模型能力快速發(fā)展，Agent形態(tài)還在快速演進(jìn)，整個賽道仍處于早期。從AI的角色扮演走到模型能力專家化，還有多遠(yuǎn)？

文｜徐鑫

編｜任曉漁

大模型的世界不缺熱點。

近日，OpenAI發(fā)布的Sora大模型引爆科技圈，大模型能力又一次迎來炸裂更新。而在底層大模型技術(shù)快速迭代之外，過去大半年里行業(yè)內(nèi)的最熱門話題當(dāng)屬AI Agent。

這也是個分歧和共識并存的領(lǐng)域，引發(fā)了從巨頭到創(chuàng)業(yè)者和投資圈的共同關(guān)注。

分歧在于，到底什么才算Agent，人們的認(rèn)知不一。比如OpenAI官方推出的GPTS到底算不算Agent，到底是自動化還是輔助式協(xié)作，人們看法有差別。另外，中文里它還有“代理”、“智能體”等不同提法。

而AI巨頭、平臺企業(yè)和各類創(chuàng)業(yè)公司用行動表達(dá)了對這一領(lǐng)域的看好，積極布局Agent開發(fā)平臺、框架或應(yīng)用。OpenAI無疑是風(fēng)向標(biāo)。OpenAI CEO山姆·奧特曼稱，未來各行各業(yè)，每個人都可以擁有AI Agent。去年11月OpenAI發(fā)布自定義GPT，到今年1月GPT Store正式上線時，據(jù)稱該平臺已經(jīng)有了超300萬個GPTs。比爾蓋茨還發(fā)長文指出，AI Agent將徹底改變?nèi)藗兪褂糜嬎銠C的方式。

在國內(nèi)，百度、阿里、字節(jié)、智譜等一眾企業(yè)都推出了各類Agent平臺，也有不少企業(yè)從應(yīng)用層發(fā)力，如360、瀾碼科技、實在智能等從安全、財務(wù)、人事等場景探索Agent落地。

Agent為什么會成為香餑餑？國內(nèi)企業(yè)目前是如何切入Agent賽道？創(chuàng)業(yè)公司和平臺企業(yè)的優(yōu)劣勢是什么？Agent距離真正改變生產(chǎn)生活，還有多遠(yuǎn)？

大佬都愛Agent

2024年被業(yè)界視作Agent落地元年。

上個月的2024CES上，被問及2024年AI領(lǐng)域可能有哪些重大突破時，吳恩達(dá)回答，大型語言模型到大型視覺模型的轉(zhuǎn)變，自動化智能體（autonomous agents ）的崛起和邊緣智能。

新年伊始，文生視頻大模型Sora的爆火，視覺模型技術(shù)已迎來突破，這也讓業(yè)界頗為期待Agent的應(yīng)用和落地。

實際上過去大半年，Agent在大模型里的火爆有目共睹。去年下半年時，硅谷科技記者M(jìn)att Schlicht統(tǒng)計稱，至少有100個項目在將Agent商業(yè)化。據(jù)一家投資機構(gòu)不完全統(tǒng)計，他們觀察到去年下半年有二十多個Agent項目完成融資。

也有人稱，去年年中以后，大模型賽道上創(chuàng)業(yè)者和投資人的關(guān)注點一下子從模型本身轉(zhuǎn)移到了Agent上。

而如果追溯當(dāng)下這波Agent 熱潮，不少人把去年三月底開始刷屏的AutoGPT視作開始。作為一個開源項目，AutoGPT創(chuàng)造了Github上的星標(biāo)上漲記錄。它由大語言模型驅(qū)動。用戶用自然語言設(shè)定目標(biāo)，AutoGPT能自動將目標(biāo)分解成子任務(wù)，連接互聯(lián)網(wǎng)或使用其他工具來實現(xiàn)目標(biāo)。

與ChatGPT不同，用戶使用AutoGPT時不需要頻繁提問，只需要給AutoGPT設(shè)定一個一個AI名稱、描述和目標(biāo)，它就能自己完成項目。這一項目很快就在GitHub上成為頂流。

而Agent爆火也離不開AI巨頭OpenAI 的添磚加瓦。

2023年年中，當(dāng)時還是OpenAI聯(lián)合創(chuàng)始人的Andrew Karpathy在一個開發(fā)者活動的發(fā)言被廣為傳播。“如果一篇論文提出了某種不同的訓(xùn)練方法，OpenAI內(nèi)部會嗤之以鼻，認(rèn)為都是我們玩剩下的。但是當(dāng)新的AI Agent論文出來時，我們會十分認(rèn)真且興奮地討論”。

Andrew Karpathy還指出，普通人、創(chuàng)業(yè)者和極客在構(gòu)建AI Agents方面相比OpenAI這樣的公司更有優(yōu)勢。

也是這一時間段，OpenAI 應(yīng)用研發(fā)主管Lilian weng 在一篇博文里定義了基于LLM構(gòu)建AI Agents的框架。她指出，Agent=LLM（大型語言模型）+記憶（Memory）+規(guī)劃技能（Planning）+工具使用（Tool Use），其中，LLM是智能體的大腦，而記憶、規(guī)劃和工具使用能力是關(guān)鍵組件。它也成為大模型時代Agent的經(jīng)典定義。

到2023年11月，OpenAI DevDay上，OpenAI推出其官方Agent開發(fā)框架Assistant API，并宣布將推出GPT Store，Agent熱潮進(jìn)一步發(fā)酵。

同一時間段，比爾蓋茨寫了一篇長文看多Agent領(lǐng)域。他預(yù)言五年內(nèi)，Agent將改變?nèi)藗兪褂秒娔X的方式，顛覆軟件產(chǎn)業(yè)。除了OpenAI和各路大佬動向不斷，硅谷還涌現(xiàn)了大量的AI Agent創(chuàng)業(yè)項目或產(chǎn)品，比如BabyAGI、MetaGPT、GPT Researcher等。據(jù)云基礎(chǔ)設(shè)施服務(wù)商E2B的不完全統(tǒng)計和分類，在編程、個人助手、生產(chǎn)力、財務(wù)等多個細(xì)分場景都有大量的開源和閉源項目。

巨頭微軟也推出了多類Agent 架構(gòu)，以代碼為中心的TaskWeaver，還有多Agent 框架 AutoGen。英偉達(dá)的研究人員則利用ChatGPT技術(shù)制作了一個智能體Voyager，它會自己玩《我的世界》，能完成游泳、采集植物、獵豬、開采金礦、建造房屋等操作。

除了單智能體類應(yīng)用，還有多智能體類項目。最知名的多智能體項目當(dāng)屬斯坦福大學(xué)和谷歌合作的斯坦福小鎮(zhèn)（Smallville ）開源實驗。在這個實驗中，研究人員創(chuàng)建了一個由25名智能體組成的虛擬小鎮(zhèn)，并讓其中一個策劃一個情人節(jié)派對。這些智能體能彼此交流，按照設(shè)定做出相應(yīng)的決策。

什么是Agent，為什么成為香餑餑？

從大佬到創(chuàng)業(yè)公司紛紛看好Agent，首先在于它延展了大模型的能力。

一位人工智能領(lǐng)域資深技術(shù)觀察者介紹，當(dāng)下，Agent的記憶、規(guī)劃以及使用工具的能力都是在彌補大模型現(xiàn)在還比較弱的地方。Agent本質(zhì)是以大模型為核心，擴展大模型的潛力，目標(biāo)是成為強大的通用問題解決方案。

網(wǎng)易數(shù)帆CodeWave產(chǎn)品技術(shù)負(fù)責(zé)人就告訴數(shù)智前線，其實不用把Agent想得太復(fù)雜，它表現(xiàn)出來就像自動化操作，底層還是基于大模型的能力。OpenAI官方定義的它的幾大能力里，比如使用工具，調(diào)用搜索引擎，外接數(shù)據(jù)或第三方API，實際上增強了大模型的能力。

致遠(yuǎn)互聯(lián)高級副總裁蔣蜀革則判斷，在企業(yè)級場景里應(yīng)用中，Agent跟大模型的落地高度關(guān)聯(lián)的。蔣蜀革認(rèn)為，目前業(yè)界已經(jīng)很務(wù)實，非常理性看待大模型的能力，光靠大模型落不了地。比如企業(yè)的數(shù)據(jù)、規(guī)則、業(yè)務(wù)上下文都非常重要，當(dāng)下大語言模型提供不了外部的實時信息，也無法訪問內(nèi)部數(shù)據(jù)，這很難支撐企業(yè)內(nèi)場景的應(yīng)用。“而Agent 能夠感知環(huán)境，感知上下文，自己做業(yè)務(wù)規(guī)劃，結(jié)合企業(yè)的數(shù)據(jù)、知識、企業(yè)的業(yè)務(wù)系統(tǒng)去走。這個落地的框架是越來越清晰的。”

也有人把大模型比喻成大腦，而Agent的能力則讓它多了四肢。實在智能的算法負(fù)責(zé)人歐陽認(rèn)為，大模型和Agent的最大區(qū)別就在于Agent對于工具的使用，Agent是大模型進(jìn)一步落地的必然選擇，比如在智能客服、文案的生成類任務(wù)時，大語言模型本質(zhì)上還是在意圖理解和對話生成的能力，但在真正的企業(yè)應(yīng)用場景里，對話類任務(wù)只占日常工作中比較少的一部分。

許多工種需要操作各類業(yè)務(wù)系統(tǒng)，完成指定業(yè)務(wù)流程。比如財務(wù)要操作財務(wù)類軟件，完成報稅報銷和財務(wù)稽核工作；而法務(wù)要審核很多合同，起草法務(wù)文件，這些都要跟大量的業(yè)務(wù)系統(tǒng)打交道。“在這些場景里，只有大模型，相當(dāng)于有一個非常智能的大腦，但是它沒有沒有手腳去真正操作，因此大模型和各類自動化工具，例如RPA（機器人流程自動化）等，就存在一個很好的結(jié)合點”，歐陽說。

另外，業(yè)界也看中Agent能夠與環(huán)境互動的能力，它能理解目標(biāo)，拆解任務(wù)，并且調(diào)用工具執(zhí)行任務(wù)。原來一些步驟和流程無法按照一個復(fù)雜的任務(wù)線來串起來，Agent以大語言模型作為一切任務(wù)的中心，就可以處理復(fù)雜的任務(wù)了。

瀾碼科技創(chuàng)始人兼CEO周健認(rèn)為，傳統(tǒng)的軟件需要人去適應(yīng)機器，Agent最核心的特點是它能對環(huán)境有感知，并且跟環(huán)境互動。以RPA為例，作為傳統(tǒng)的自動化工具，RPA能實現(xiàn)某些步驟的自動化作業(yè)，但這些能被自動化的步驟非常有限。只要該步驟的業(yè)務(wù)上下文和業(yè)務(wù)理解的規(guī)則上稍微復(fù)雜一點，RPA就很難完成。比如金融行業(yè)信貸審核流程可能涉及到上百個步驟，RPA能夠去自動化完成的只有幾個。

而大模型實際上提供了極其便利的語言理解能力及推理能力。因為有了語言理解能力，其實人與機器的互動模式就變得更靈活，機器可以適應(yīng)人。“能夠被自動化的業(yè)務(wù)步驟數(shù)量大大增加，能形成規(guī)�；纳a(chǎn)力。”周健說。

正如比爾蓋茨認(rèn)為，Agent未來會變成一個非常普遍的存在，改變?nèi)藗兪褂秒娔X的方式，顛覆軟件行業(yè)，也有不少行業(yè)人士認(rèn)為，Agent正在引發(fā)人和機器互動的范式變遷。

一位大廠技術(shù)高管認(rèn)為，新范式變遷下，總會帶來平臺級的機會和新的入口，這其實會給很多創(chuàng)業(yè)公司帶來新的機會。這也是從行業(yè)巨頭到創(chuàng)業(yè)者及投資市場普遍比較興奮的原因。

國內(nèi)企業(yè)動作頻頻

范式變遷的潛在機遇也吸引了國內(nèi)的一大批企業(yè)，大廠、AI公司和新興創(chuàng)業(yè)團隊都積極布局這一賽道。

根據(jù)數(shù)據(jù)前線不完全統(tǒng)計，目前不同角色進(jìn)入市場的布局重點不一。

一類是平臺模式。手持自研大模型的廠商如阿里和百度都推出了智能體開發(fā)平臺。阿里達(dá)摩院的魔搭社區(qū)推出ModelScopeGPT，百度的靈境矩陣平臺全新升級為文心大模型智能體平臺。對這兩家既有自研大模型，同時有云計算業(yè)務(wù)的企業(yè)而言，培育和完善Agent的開發(fā)者生態(tài)符合其定位和需求。

也有一眾企業(yè)對標(biāo)OpenAI的GPT Store，面向更廣泛人群，推出可快速生成Agent的智能體商店，比如昆侖萬維、釘釘、智譜AI、字節(jié)等。面向泛C端市場推出智能體商店，看中的自然是Agent的入口屬性和對應(yīng)用生態(tài)的變革。釘釘總裁葉軍在釘釘7.5版本發(fā)布會上就斷言，AI Agent已經(jīng)成為當(dāng)下最佳AI應(yīng)用入口，釘釘?shù)哪繕?biāo)是成為低門檻、高頻和開放的AI助理平臺，他還表示，未來三年，要有1000萬個AI助理在釘釘上產(chǎn)生。

頭部云廠商里，手握自研大模型的企業(yè)還有華為和騰訊，這兩家企業(yè)在Agent領(lǐng)域也有動作。它們的技術(shù)研究團隊分別都聯(lián)合大學(xué)發(fā)表了專門的論文，發(fā)布了各自的Agent框架。

去年12月，騰訊和德州大學(xué)達(dá)拉斯分校的研究團隊合作開發(fā)的名為AppAgent的項目，進(jìn)入公眾視野。該項目希望可以通過自主學(xué)習(xí)和模仿人類的點擊和滑動手勢，在手機上執(zhí)行各種任務(wù)，有人稱它相當(dāng)于手機上的智能“按鍵精靈”。而華為方面，華為諾亞方舟實驗室與倫敦大學(xué)學(xué)院（UCL）、牛津大學(xué)的團隊在去年12月底發(fā)表論文，提出了一種通用框架模型盤古Agent，用于將結(jié)構(gòu)化推理整合到AI Agents中并進(jìn)行學(xué)習(xí)。

除了智能體商店和Agent開發(fā)框架上的布局，還有大量企業(yè)從企業(yè)級Agent應(yīng)用和平臺層發(fā)力。比如瀾碼科技、實在智能等廠商都希望幫助企業(yè)構(gòu)建企業(yè)內(nèi)的一站式Agent設(shè)計、使用和管理平臺，同時這些企業(yè)也在一些先行場景里打造標(biāo)桿Agent應(yīng)用，形成示范效應(yīng)。

“如果把大模型視作基礎(chǔ)設(shè)施，目前它已經(jīng)在橫向整合，那么上面的PaaS層其實也會橫向整合，企業(yè)內(nèi)會出現(xiàn)一個Agent中間件的機會。”瀾碼科技的CEO周健認(rèn)為。但由于行業(yè)仍然處于早期，這類平臺當(dāng)下的重點則在積極探索企業(yè)內(nèi)應(yīng)用場景，構(gòu)建標(biāo)桿應(yīng)用，進(jìn)而從應(yīng)用層向中間件平臺建設(shè)發(fā)力。

周健觀察到，目前企業(yè)內(nèi)Agent應(yīng)用最容易切入和落地的，是在財務(wù)這類數(shù)字化程度比較高、有相應(yīng)的國家標(biāo)準(zhǔn)化規(guī)范的場景，因為有比較明確的企業(yè)SOP流程規(guī)范或數(shù)據(jù)沉淀。目前瀾碼科技的企業(yè)級AI Agent和輕應(yīng)用已經(jīng)在一些企業(yè)先行落地應(yīng)用。同時，瀾碼科技也在人事等不同場景尋找與Agent結(jié)合的方式。

也有一些企業(yè)和平臺在成熟的業(yè)務(wù)板塊里引進(jìn)了基于大模型的Agent能力。比如網(wǎng)易數(shù)帆CodeWave就嘗試將低代碼平臺和Agent的能力結(jié)合，來降低低代碼工程師操作平臺的難度。

該平臺產(chǎn)品技術(shù)負(fù)責(zé)人介紹，他們的應(yīng)用場景是利用Agent來完成自然語言輸出邏輯的編寫。這是低代碼里應(yīng)用非常高頻，但是非常難操作的一個功能。一般簡單的業(yè)務(wù)邏輯，可能需要半個小時左右編寫，復(fù)雜點的需要耗時半天到一天。目前接入Agent的能力，能自動分析用戶的訴求，并拆解成可執(zhí)行的任務(wù)，完成相關(guān)的邏輯編寫。用戶只需確認(rèn)即可，幾分鐘就能完成此前半天到一天的工作。

無論是平臺還是創(chuàng)業(yè)團隊，都已經(jīng)開始啃起了Agent這塊蛋糕。新浪潮下，一位AI行業(yè)資深人士認(rèn)為，Agent能力的落地，尤其在應(yīng)用層，大平臺和創(chuàng)業(yè)團隊可能站在的是同一個起跑線，考驗不同企業(yè)對應(yīng)用層能力的挖掘和場景及需求的洞察。

Agent落地缺什么？

“大模型能力還在快速發(fā)展，Agent目前是個在發(fā)展變化的概念，它的形態(tài)還在演進(jìn)中。”一位ToB領(lǐng)域的資深人士告訴數(shù)智前線，整個賽道正處于早期。

有觀點稱，Agent本質(zhì)是模型能力專家化，但當(dāng)下它更像是AI的角色扮演，一個同質(zhì)化基礎(chǔ)大模型，通過一些Prompt加人設(shè)，Agent的行動要滿足人設(shè)。Zilliz 合伙人兼產(chǎn)品總監(jiān)郭人通此前在一個論壇上表示，后期Agent要成為行業(yè)專家，才具備核心價值。

那么，Agent如何從高中生升級到大學(xué)生及行業(yè)專家？業(yè)界普遍關(guān)注到領(lǐng)域模型或“世界模型”的重要性。

周健告訴數(shù)智前線，當(dāng)下基于大語言模型的能力，Agent有與人互動、驗證虛擬環(huán)境的可能性，但是Agent需要不同的領(lǐng)域模型或世界模型，才能完成對各類環(huán)境的建模和互動反饋。而這也是各類企業(yè)當(dāng)下的的能力差異點，比如瀾碼科技就擅長業(yè)務(wù)流程的世界模型構(gòu)建。

不管是專家知識還是領(lǐng)域模型建設(shè)，那些對企業(yè)內(nèi)知識更為重視，有更好沉淀的組織相對走在前面。近年來，許多企業(yè)重視用數(shù)據(jù)驅(qū)動決策，未來企業(yè)內(nèi)建設(shè)的各類指標(biāo)庫與Agent結(jié)合，有望提升Agent的智能程度。一些指標(biāo)平臺已經(jīng)看到了空間，數(shù)智前線獲悉比如大數(shù)據(jù)分析和指標(biāo)平臺kyligence就計劃朝向Agent方向打造產(chǎn)品。

周健認(rèn)為，除了那些已有的體系化積累，基于經(jīng)驗和小數(shù)據(jù)得來的知識，也是未來Agent落地必不可少的。例如如何評估財務(wù)的健康度，什么叫做應(yīng)收賬款比例過高，“高”在不同行業(yè)、不同企業(yè)定義和意義并不一樣。過去各類組織較少花精力去數(shù)字化這部分知識，未來需要補齊。

網(wǎng)易CodeWave低代碼平臺技術(shù)負(fù)責(zé)人稱之為AI友好。他舉例目前CodeWave智能開發(fā)平臺之所以快速能接入Agent能力，在自然語言邏輯編寫效果不錯，也是因為它們在代碼語言上做了一些準(zhǔn)備和限定。

代碼生成技術(shù)此前遇到的很大問題在于，只能生成固定領(lǐng)域或者固定技術(shù)棧的代碼，但其實Web開發(fā)實踐中，前端后端技術(shù)棧非常多。

此前CodeWave智能開發(fā)平臺構(gòu)建了一種NASL語言，這種語言比較收斂，抹平了前后端的一些類型的差異，能夠真正實現(xiàn)全�？梢暬帉�。去年大模型到來后，他們發(fā)現(xiàn)收斂的編程語言更利于AI的學(xué)習(xí)和訓(xùn)練以及生成。“這是意外之喜。統(tǒng)一編程語言的設(shè)計，對AI是非常友好的”。

大模型能力本身也對Agent的能力和形態(tài)產(chǎn)生影響。智譜CEO張鵬此前受訪時就說，Agent的本源仍然是大模型的基礎(chǔ)能力，大腦的智力水平足夠高，才能談理解、推理、規(guī)劃和執(zhí)行這些事。

一位Agent應(yīng)用開發(fā)者告訴數(shù)智前線，一些基于GPT-4上能使用的能力，遷移到一些國內(nèi)大模型上就不可用了，“這非常常見，其實也對Agent的實際落地造成了非常大的困擾。”這需要國內(nèi)基礎(chǔ)大模型廠商的共同努力。

而除了Agent的各種能力本身，實在智能Agent智能體項目核心算法負(fù)責(zé)人認(rèn)為，安全機制的構(gòu)建也必不可缺，“不僅需要官方定義的那幾個能力，還需要安全性和多Agent之間的協(xié)同，才能在B端更好落地。目前這也是我們花了很大精力做的工作。”

2024年被周健視作Agent的元年。他認(rèn)為，經(jīng)過一年發(fā)展，大模型公司也在思考商業(yè)化問題，而大模型要落地，需要AI Agent公司來完成，因此，2024應(yīng)用為王，行業(yè)要用各種各樣的新應(yīng)用，證明生產(chǎn)力確實是能夠被大模型封裝，走向智能。“某種程度上，整個行業(yè)需要一個爆款”。

發(fā)表評論