訂閱
糾錯
加入自媒體

一文讀懂什么是AIGC、ChatGPT、大模型

2023-05-15 14:02
張棟偉
關(guān)注

昨天有讀者私信我,能否解釋一下AIGC和ChatGPT是什么樣的關(guān)系?

確實,在短短的6個月時間里,AIGC、ChatGPT、大模型等新詞匯一下成為媒體熱詞,加上所謂“人工智能將取代你的工作”之類的焦慮,張棟偉覺得有必要寫這樣一篇科普。

本文將力求簡單化的說明這次人工智能浪潮帶來的新詞匯和它的意義,帶你一文讀懂什么是AIGC、ChatGPT、大模型。

1、什么是AI

AI,人工智能(Artificial Intelligence)的英文縮寫。

AI是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應用系統(tǒng)的一門新的技術(shù)科學。

人工智能是計算機科學的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。

工廠里的自動生產(chǎn)線,小米公司的“鐵蛋”機器狗,火車站的人臉識別通道,科大訊飛的語音輸入法,都是屬于AI系統(tǒng)的應用。

2、什么是AIGC

AIGC,全名“AI Generated Content”,中文直譯就是“人工智能生成內(nèi)容”,也可以稱為“生成式AI” (Generative AI)。例如AI文本續(xù)寫,文字轉(zhuǎn)圖像的AI圖、AI數(shù)字化主持人等,都屬于AIGC的范疇。

3、什么是大模型

首先解釋,什么是GPT。

GPT的全稱,是Generative Pre-Trained Transformer(生成式預訓練轉(zhuǎn)換器)是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓練的、文本生成的深度學習模型。

GPT是AIGC的一個種類。

在ChatGPT之前,被公眾關(guān)注的AI模型是用于單一任務的,比如全球所知的“阿爾法狗”(AlphaGo)可以基于全球圍棋棋譜的計算,打贏所有的人類圍棋大師。谷歌進一步開發(fā)的“AlphaZero”在圍棋、國際象棋和日本象棋等項目上,都是所向無敵。

這種專注于某個具體任務建立的AI數(shù)據(jù)模型,叫“小模型”。

ChatGPT與這種“小模型”不同,GPT大模型更像人類的大腦。它兼具“大規(guī)模”和“預訓練”兩種屬性,可以在海量通用數(shù)據(jù)上進行預先訓練,能大幅提升AI的泛化性、通用性、實用性。

基于GPT機制建立的AI數(shù)據(jù)模型,就叫“大模型”。

4、什么是ChatGPT

ChatGPT是由美國OpenAI公司發(fā)布的大模型。

由于ChatGPT 3.5展現(xiàn)了超出現(xiàn)實預期的智能數(shù)據(jù)能力,引發(fā)了一場新的全球人工智能競賽。2023年3月,ChatGPT -4進一步提高了AI的能力。

5、中國有ChatGPT嗎?

首先再次強調(diào),ChatGPT是特指美國OpenAI公司的大模型。這是一個產(chǎn)品名稱。

但是,領(lǐng)先的產(chǎn)品,往往會成為行業(yè)代名詞,比如我們說搜索的時候,會簡單的說“百度一下”。但實際上,搜索引擎還有360、Bing、谷歌等其他方式。

目前,我們把與ChatGPT類似的產(chǎn)品,暫時叫“類ChatGPT”產(chǎn)品或者直接叫“大模型”產(chǎn)品。

在ChatGPT火爆以后,中國的科技企業(yè)紛紛“趕上潮流”,推出了自己的大模型產(chǎn)品。以下是《中國企業(yè)家》雜志統(tǒng)計出的一些知名公司的產(chǎn)品列表。

但是,這種復雜的技術(shù)模型,顯然不是一朝一夕就能實現(xiàn)。多個國內(nèi)的大模型被國外技術(shù)人員質(zhì)疑,是用ChatGPT進行“套殼”,用以提升品牌形象和股價。

中國的GPT大模型要成熟,還需要比較多的時間和機會,本文后面部分會繼續(xù)說明。

6、ChatGPT有什么用途

ChatGPT是一種能生成文本、圖像等內(nèi)容的復雜系統(tǒng)。

OpenAI的戰(zhàn)略伙伴微軟(Microsoft)已將該技術(shù)添加到其Office MS 365辦公套件及搜索引擎必應(Bing)等產(chǎn)品中。

微軟的競爭對手谷歌(Google)也推出了類似的搜索工具Bard。

ChatGPT可以進行從歷史到哲學等話題的對話,生成不同風格的文案、文章、歌詞、詩歌,甚至直接生成計算機代碼,或者對已有的計算機程序代碼提供修改建議。ChatGPT也能處理視覺信息,諸如回答關(guān)于照片內(nèi)容的問題。

ChatGPT是基于從互聯(lián)網(wǎng)上搜羅的大量文章、圖像、網(wǎng)站和社交媒體內(nèi)容,以及與OpenAI人類雇工的實時對話(主要是英語)進行訓練的。實際上,早在2014年微軟公司面向中國推出了AI聊天機器人小冰,目前不知道小冰的對話內(nèi)容是否也是ChatGPT學習的數(shù)據(jù)來源之一。

ChatGPT學著模仿寫作的語法和結(jié)構(gòu),輸出常用表達。它還學習識別圖像中的形狀和圖案,如一只貓、一個孩子或一件襯衫的輪廓。它還可以將單詞和短語與這些形狀和圖案相匹配,允許用戶詢問圖像的內(nèi)容,如貓在做什么或襯衫的顏色是什么。

因為ChatGPT的原始數(shù)據(jù)來自于公開的互聯(lián)網(wǎng),而互聯(lián)網(wǎng)上的信息并不總是準確的。因此,ChatGPT給出的答案結(jié)果,并沒有經(jīng)過事實核查,不能100%保證準確,甚至有些完全是“一本正經(jīng)的胡說八道”。

ChatGPT需要依靠人類員工的反饋來提高準確性。

其他類似的大模型,同樣如此,都需要非常海量的人工能力,來幫助大模型提升準確性。這就是類似于在中國,雖然大家覺得高德地圖、百度地圖、騰訊地圖很智能,但是實際上,它們不僅僅是在調(diào)用衛(wèi)星數(shù)據(jù)、交通部門數(shù)據(jù),還有數(shù)以萬計的人工“標記員”在幫助和輔助數(shù)據(jù)修正工作。

7、ChatGPT之類的大模型是如何工作的?

前面已經(jīng)說過,GPT的意思是“生成式預訓練轉(zhuǎn)換器(Generative Pre-trained Transformer),這是大模型的核心技術(shù)。

轉(zhuǎn)換器是在數(shù)據(jù)序列中尋找長程模式的專門算法。轉(zhuǎn)換器不僅能學會預測一個句子中的下一個詞,還能學會預測一個段落中的下一個句子以及一篇文章中的下一個段落。這就是為什么它能夠在長文本中緊扣主題。

由于轉(zhuǎn)換器需要大量的數(shù)據(jù),它的訓練分為兩個階段:首先,它用通用數(shù)據(jù)進行預訓練,這種數(shù)據(jù)更容易大量收集;然后,根據(jù)它要執(zhí)行的具體任務,再利用定制的數(shù)據(jù)進行微調(diào)。

張棟偉在最近的兩篇文章中多次強調(diào),大模型的核心取決于三個因素:數(shù)據(jù)、算力和場景。

所有的大模型都要受制于該公司所能合法獲得的數(shù)據(jù)量,還要具備能支撐這些數(shù)據(jù)的算力。最后,還需要有可以商業(yè)化的場景,形成投資-產(chǎn)出的正循環(huán)。

8、ChatGPT這樣的大模型收費嗎?

目前,包括美國的ChatGPT,以及國內(nèi)的各種大模型,都是免費的。需要個人去官網(wǎng)注冊申請。

大模型產(chǎn)品都會提供一個API(應用程序編程接口),允許各公司將該技術(shù)整合到自家產(chǎn)品或后端解決方案中。這種企業(yè)定制版本,以及面向個人的高級版本,會收費。

需要再次提示的是,上文已經(jīng)說過,目前大模型都還需要人工進行優(yōu)化,因此你在大模型輸入的內(nèi)容,以及大模型給你輸出的答案結(jié)果,這些信息都會被開發(fā)者公司閱讀到。

所以,請不要輸入隱私數(shù)據(jù)或敏感的公司信息。

9、政府對AIGC的態(tài)度

世界各國政府正在探索規(guī)范生成式AI工具的方式,擔心它們可能被濫用于犯罪、傳播虛假信息或威脅國家安全等情況。

4月11日,國家互聯(lián)網(wǎng)信息辦公室(簡稱“網(wǎng)信辦”)發(fā)布通知,就《生成式人工智能服務管理辦法(征求意見稿)》向社會公開征求意見,意見反饋截止時間為5月10日。

網(wǎng)信辦表示, “國家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應用、國際合作,鼓勵優(yōu)先采用安全可信的軟件、工具、計算和數(shù)據(jù)資源”。

網(wǎng)信辦定義,所謂“生成式人工智能”,是指基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。網(wǎng)信辦明確研發(fā)、利用生成式人工智能產(chǎn)品,面向中華人民共和國境內(nèi)公眾提供服務的,適用本辦法。

在服務提供者的準入資格方面,《意見征求稿》要求利用生成式人工智能產(chǎn)品向公眾提供服務前,應當按照《具有輿論屬性或社會動員能力的互聯(lián)網(wǎng)信息服務安全評估規(guī)定》(2018年11月發(fā)布)向國家網(wǎng)信部門申報安全評估,并按照《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》(2021年12月發(fā)布)履行算法備案和變更、注銷備案手續(xù)。

《意見征求稿》詳細地分別對提供生成式人工智能產(chǎn)品或服務,對用于生成式人工智能產(chǎn)品的預訓練、優(yōu)化訓練數(shù)據(jù)提出明確要求。

10、AI會搶人類飯碗嗎?

任何最新發(fā)明的技術(shù),都會對當下的崗位和未來的工作產(chǎn)生重大影響。

在此前的計算機、互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的技術(shù)浪潮中,都會藍領(lǐng)階層產(chǎn)生了重大影響。

當前業(yè)內(nèi)普遍認為,AIGC將對白領(lǐng)職業(yè)產(chǎn)生較大影響。

但是,回首往事,會發(fā)現(xiàn)計算機、互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)三大革命性的新技術(shù),使得社會經(jīng)濟變得更加生機勃勃。

這是因為,經(jīng)濟學家已經(jīng)發(fā)現(xiàn),新技術(shù)的相關(guān)影響往往包含三個方面:

(1)一些勞動者提高了生產(chǎn)力;

(2)部分崗位實現(xiàn)自動化或被合并;

(3)產(chǎn)生出以前不存在的新崗位。

由于新崗位的生產(chǎn)效率,要優(yōu)于被取代崗位的生產(chǎn)效率,所以實際上整個社會的生產(chǎn)效率是提升的。

但是具體到個人,只能說是:

“最先掌握AI的人,將會比較晚掌握AI的人有競爭優(yōu)勢”。

這句話,放在計算機、互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的開局時期,都是一樣的道理。

如果你也想盡早掌握AI技術(shù),請關(guān)注我。

作者:張棟偉 (資深互聯(lián)網(wǎng)人士、市場營銷專家、大學生就業(yè)創(chuàng)業(yè)導師)

       原文標題 : 張棟偉:一文讀懂什么是AIGC、ChatGPT、大模型

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號