訂閱
糾錯
加入自媒體

從“奇點”到“大爆炸”,生成式AI開啟“十年周期”

世界是復雜的,沒有人知道未來會怎樣,但如果單純從技術(shù)的角度,我們總是能夠沿著技術(shù)發(fā)展的路徑,找到一些主導未來趨勢的脈絡。

從Sora到Suno,從OpenAI到Copilot、Blackwell,這些熱詞在大眾眼里或許還分不清楚,但很多人已經(jīng)用上各種“ChatGPT”,或聊天或創(chuàng)作。不知不覺間,我們已經(jīng)卷入新一輪AI浪潮中。

這輪人工智能浪潮,自ChatGPT這類生成式AI工具問世,被迅速引爆。AI大模型從研究走向應用,復用成本大幅降低,各種應用得以更快滲透進各行各業(yè)。

IDC發(fā)布報告稱,2027年全球人工智能IT總投資規(guī)模有望從2022年的1324.9億美元增至2027年的5124.2億美元,年復合增長率(CAGR)為31.1%。

聚焦生成式AI,IDC預測,全球生成式AI市場年復合增長率將達85.7%,到2027年全球生成式AI市場規(guī)模將接近1500億美元。

英偉達CEO黃仁勛表示,生成式AI已經(jīng)開啟了全新的投資周期,已經(jīng)進入了“十年周期”(技術(shù)從出現(xiàn)、傳播到大規(guī)模應用所需的時間)的第一年。

當生成式AI從一個“奇點”到迎來“大爆炸”時刻,其將在現(xiàn)實世界發(fā)生哪些改變?又將激發(fā)怎樣的潛力?

生成式AI迎來“三個轉(zhuǎn)變”

過生成式AI技術(shù)可分為四個層次,即面向消費者應用;大語言模型(LLM)等基礎(chǔ)技術(shù);支持服務的云基礎(chǔ)設施;以及對于開發(fā)和運營至關(guān)重要的半導體。

從技術(shù)發(fā)展看,今年生成式AI將從純理論探討階段,全面進入到業(yè)務應用階段。過去一年,大部分企業(yè)和機構(gòu)并沒有真正打造出生成式AI系統(tǒng);而今年,生成式AI系統(tǒng)將全面進入到生產(chǎn)當中,企業(yè)將真正地開始使用生成式AI工具。

對于生成式AI本身,即將迎來三個方面的轉(zhuǎn)變。

首先,要把生成式AI投入到企業(yè)以及業(yè)務用例的過程中,就要從構(gòu)建訓練基礎(chǔ)架構(gòu)轉(zhuǎn)向構(gòu)建推理基礎(chǔ)架構(gòu)。

到目前為止,大部分企業(yè)往往是通過對開源基礎(chǔ)模型進行調(diào)優(yōu)、優(yōu)化或者是互聯(lián),來實現(xiàn)自己的某些功能和需求。

對于各個企業(yè)、各個垂直行業(yè)領(lǐng)域的企業(yè)來說,無論是GenAI還是GPT4,大語言模型的訓練成本是高昂的。特別是對于垂直行業(yè)的企業(yè)用戶,不會在業(yè)務推進過程中直接采用這些模型。

如果未來需要將AI能力賦予企業(yè)的業(yè)務,那么企業(yè)就需要進一步開發(fā)已有的模型,從而讓這些模型在部署到垂直行業(yè)的生產(chǎn)中時,可以真正地轉(zhuǎn)化為生產(chǎn)力。

而這種轉(zhuǎn)變也對企業(yè)提出了更加明確的要求:如何更好地設計出這種推理基礎(chǔ)架構(gòu)?該把它們放在哪里?如何確保其安全?

其次,是企業(yè)的關(guān)注點將越來越多地將從寬泛的實驗轉(zhuǎn)向自上而下的戰(zhàn)略推進,即挑選出少數(shù)幾個真正具有變革意義的生成式AI應用項目。

去年,很多企業(yè)都在考慮采用生成式AI技術(shù)。但如今,企業(yè)已經(jīng)認識到,要應用生成式AI技術(shù),每個項目都非常龐大,需要占用大量人力、物力、財力,才能構(gòu)建和實施一個能夠投入生產(chǎn)的生成式AI系統(tǒng)。

到了今年,一方面,生成式AI領(lǐng)域?qū)谐砂偕锨酥辽先f的潛在用例,但另一方面,由于每一個企業(yè)的資源有限,因此只能選擇其中幾個重點實施。

對于企業(yè)的CIO和領(lǐng)導者,必然會面臨一個問題:就是從幾百個AI項目中,優(yōu)先選擇幾個進行實施。這其中的風險在于:一旦選對了,這些項目將對業(yè)務產(chǎn)生正向影響;而萬一選錯,可能就會造成大量的資源浪費。

要想做出一個正確的選擇,各個企業(yè)必須要充分理解GenAI價值,以及生成式AI最有可能從哪些方面能夠為企業(yè)提升生產(chǎn)力而賦能。

第三,是用戶對于AI投入的成本考量,從對“訓練成本”的計算轉(zhuǎn)向?qū)?ldquo;運營成本”的衡量。

在理論研究和訓練階段,生成式AI的成本取決于構(gòu)建模型的復雜程度,以及架構(gòu)開發(fā)和維護人員的規(guī)模,除此之外再無其他成本可言。

但當企業(yè)用戶開始實施部署和應用生成式AI工具時,現(xiàn)實的運營成本就會成為企業(yè)用戶面臨的最大經(jīng)濟考量。

以戴爾科技為例,其最初開始建立自己的生成式AI系統(tǒng)時,基本上會在三個月的時間里用到20臺服務器,此刻其整體運營成本是未知的。

但當這套系統(tǒng)開始被戴爾科技內(nèi)部的工程師應用時,6000名工程師每個月就需要大約5000萬次處理量,因此該系統(tǒng)最大的成本不是建立一個模型的成本,而是基于大規(guī)模處理而產(chǎn)生的巨額運營成本。

這對企業(yè)用戶而言,從訓練成本到運營成本的考慮,將是未來必將面對的一個相當現(xiàn)實的問題。

從本質(zhì)上說,生成式AI的轉(zhuǎn)變其實是技術(shù)從研發(fā)到應用的商用化過程中必然要經(jīng)歷的過程。

只是由于AI自身業(yè)務形態(tài)的改變,也將帶來更多行業(yè)的改變,其中的一個影響就是會帶動一批相關(guān)技術(shù)和應用,成為未來的熱點和趨勢。

 如何激發(fā)生成式AI  更大潛力

僅僅一年,隨著各大資本和巨頭入場,AI從底層大模型,到基礎(chǔ)設施,到機器學習操作(MLOps),再到消費端應用,生成式AI的生態(tài)已經(jīng)初步建立。

隨著今年生成式AI的進一步訓練和穩(wěn)定,行業(yè)發(fā)展將加速向下游移動,生成式AI將進一步改變?nèi)藗兊纳,乃至改變整個世界,其為企業(yè)提供了無限的想象空間,使產(chǎn)品和服務的研發(fā)過程更加高效、有趣。

面對生成式AI市場的巨大潛力,亞馬遜、谷歌、微軟、Meta等科技巨頭不甘示弱。去年12月,谷歌多模態(tài)大模型Gemini發(fā)布,包含三個版本:Nano、Pro和Ultra。

Pro對標GPT-3.5,Ultra對標GPT-4,可以處理文本之外的信息,包括圖像、視頻和音頻。同時,谷歌上線文生圖模型Imagen 2、視頻生成模型VideoPoet,推出醫(yī)療人工智能大模型MedLM,將大模型與醫(yī)療保健行業(yè)緊密結(jié)合。

去年11月,微軟將集成了GPT的Bing Chat更名為Copilot,可以免費使用GPT-4、DALL·E 3功能,并且擁有了獨立網(wǎng)站,Copilot將嵌入所有微軟旗下應用中。微軟還推出Copilot Studio,使用者可以自定義GPT、創(chuàng)建新插件、自定義工作流。

Meta則接連發(fā)布了650億參數(shù)的開源大模型 LLaMA和700億參數(shù)的LLaMA2。近日,Meta推出全新開源大模型Code Llama 70B,其準確率達到了53%,超過了GPT-3.5的48.1%,是目前評分最高的開源大模型。

2023年以來,看似默默無聞的亞馬遜頻頻出擊。去年9月,亞馬遜宣布將向人工智能初創(chuàng)公司Anthropic投資40億美元,近日,其再次宣布追加投資27.5億美元,完成了對Anthropic40億美元的投資,決心可見一斑。窗體頂端

更為重要的是,亞馬遜云科技提出了基于生成式AI的三層技術(shù)棧。

第一層是高性能基礎(chǔ)設施,過去五年,亞馬遜云科技持續(xù)加大在自研芯片方面的投入,比如Amazon Trainium和Amazon Inferentia芯片,可以提供在云上訓練模型和運行推理的最低成本。

除此之外,在GPU方面,NVIDIA多款先進算力均率先在亞馬遜云科技落地。

第二層是最廣泛的基礎(chǔ)模型選擇。亞馬遜云科技認為“沒有一個模型可以適用于所有業(yè)務場景”,因此推出Amazon Bedrock,企業(yè)可以靈活選擇適合自己的模型,更容易地構(gòu)建應用,并在保證數(shù)據(jù)安全和隱私基礎(chǔ)上,進行定制化模型的開發(fā),還無需大量的標注數(shù)據(jù)。

Amazon Bedrock提供各種領(lǐng)先的基礎(chǔ)模型供客戶選擇:既有知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。

基于Amazon Bedrock云托管服務,企業(yè)可以通過API訪問從文本到圖像的一系列強大的基礎(chǔ)模型。

值得一提的是,亞馬遜和Anthropic在生成式AI領(lǐng)域有著廣泛的合作,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領(lǐng)先的大模型之一,共包含三個模型:Haiku、Sonnet、Opus,從模型尺寸來看,可以理解為模型的中杯、大杯、超大杯。

客戶可以根據(jù)自己的商業(yè)需求,從中選擇最合適的智能、速度和價格組合。

Haiku:是響應速度最快的模型,也是成本最低的選項,在大多數(shù)純文本任務上的表現(xiàn)仍然相當出色,也同時包含多模態(tài)能力(比如視覺)。

Sonnet:適用于需要平衡性能和成本的場景,它在純文本任務上的表現(xiàn)與后面的Opus相當,但在成本上更為經(jīng)濟,適合于那些需要性能稍微好點,但預算有限的企業(yè)和個人用戶。

Opus:具有強大的推理、數(shù)學和編碼能力,接近人類的理解能力,適用于需要高度智能和復雜任務處理的場景,如企業(yè)自動化、復雜金融預測、研究和開發(fā)等。

對于Claude 3,更有行業(yè)人士認為其終結(jié)了GPT-4時代。Claude 3有兩大亮點,一個是長文本,二是多模態(tài)能力。

長文本是Claude 3的一個顯著優(yōu)勢,體現(xiàn)為在讀論文、小說等字數(shù)更多的文本時,Claude 3更擅長理解和回答用戶的相關(guān)問題。

此次Claude 3大大提升了上下文對話窗口,達到200k,可以理解為單次和模型對話能夠輸入的文本。

具體而言,Claude 3 200k的對話長度,相當于能夠單次處理超過15萬英文單詞,而GPT-4 Turbo的上下文窗口為128k,大約是9.6萬個英文單詞。同時,Claude 3也第一次允許圖像和文檔上傳。

和ChatGPT一樣,Claude 3能夠“認”出來圖里的是什么東西,直接描述,回答用戶的問題。更令人印象深刻的是,Claude 3在分析一些復雜問題時,已經(jīng)能夠和人一樣,先拆解問題,并且交由子模型來進行調(diào)度。

第三層就是應用生成式AI技術(shù)的開箱即用的云服務,進一步降低使用門檻。目前已經(jīng)推出Amazon Q這一AI助手,可以根據(jù)客戶業(yè)務進行定制,專用于辦公場景需要。

還與像Amazon QuickSight,包括智能客服的產(chǎn)品Amazon Connect,面向編程開發(fā)人員的平臺Amazon CodeWhisperer,都實現(xiàn)了非常有效的結(jié)合。

可以看到,從底層基礎(chǔ)設施到上層應用拓展,今年亞馬遜云科技在生成式AI領(lǐng)域不斷發(fā)力。不同的客戶可以根據(jù)需求選擇不同層級的產(chǎn)品,通過這三層來支持他們的業(yè)務創(chuàng)新。

此外,對于如何幫助企業(yè)快速具備生成式AI能力,亞馬遜云科技擁有豐富的專業(yè)技術(shù)支持資源,包括SA、產(chǎn)品專家、人工智能實驗室、數(shù)據(jù)實驗室、快速原型團隊、專業(yè)服務團隊,幫客戶打通應用生成式AI的“最后三公里”工程化挑戰(zhàn)。

對于作為扮演“底層架構(gòu)師”角色的亞馬遜云科技而言,大模型固然重要,但關(guān)鍵技術(shù)能力的集合才是提升企業(yè)生產(chǎn)力的根本動力。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示,“盡管大模型非常重要,但僅靠大模型對企業(yè)的生產(chǎn)是遠遠不夠的。從模型能力到真正的運營生產(chǎn)之間,企業(yè)還需要增加很多輔助能力。企業(yè)需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜云科技一系列產(chǎn)品所提供的價值所在。”

生成式AI領(lǐng)域接下來發(fā)展的最關(guān)鍵一步是什么?陳曉建表示,首先,從最底層來看,芯片性能仍然落后于需求。雖然半導體芯片的發(fā)展已經(jīng)非?,但模型本身參數(shù)規(guī)模的擴大實際上遠超芯片的能力。

“以前一個幾百萬參數(shù)的模型,就覺得已經(jīng)很大了,但現(xiàn)在動輒達到數(shù)百億的規(guī)模;A(chǔ)服務商仍需關(guān)注如何將底層能力、業(yè)務復雜度和大模型復雜度相匹配,使硬件發(fā)展趕上軟件發(fā)展規(guī)模。”

其次,他認為大模型能力本身還有很多發(fā)展空間,今天看到的模型可能代表了一個博士生水平,但是能不能做得更好?比如達到教授或者院士水平?

包括亞馬遜云科技在內(nèi)的諸多生成式AI供應商需要在未來持之以恒地去做模型能力方面的工作。

在最上層與各行各業(yè)務相結(jié)合方面,陳曉建表示,相關(guān)的SaaS解決方案非常多。

從這點上看,將生成式AI能力與垂直場景的解決方案結(jié)合需要做巨大的工作。“我們需要思考大模型如何為人類社會各行各業(yè)中的應用提供更好的模型能力、更易用的方式和更低的成本。”

無論如何,人們對未來的期許總是充滿希望。對于科技未來的走向,以AI為代表的技術(shù)進化,正在成為一場考驗人類想象力的比賽。

科技企業(yè)能做的,就是通過技術(shù)普惠,降低AI參與門檻,先把大模型打造成像電、水一樣隨取隨用的公共資源,再將生成式AI技術(shù)應用于各行各業(yè),變成真正能夠推動人類發(fā)展的生產(chǎn)力。

 相關(guān)閱讀

從“算力核彈”到生成式AI,新紀元還有多遠?

打造生成式AI應用,什么才是關(guān)鍵?

AI Agent:大模型的下一個高地

生成式AI來了,我們還能相信自己的眼睛嗎?

【科技云報道原創(chuàng)】

轉(zhuǎn)載請注明“科技云報道”并附本文鏈接

       原文標題 : 從“奇點”到“大爆炸”,生成式AI開啟“十年周期”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號