ChatGPT升級(jí)后亂殺老師傅,百度文心一言能抗住壓力嗎?
一夜之間,ChatGPT「開(kāi)眼了」。
4 個(gè)月前發(fā)布 ChatGPT 最初就只支持文本輸入和文本輸出,也就是進(jìn)行文字聊天。然而在 GPT-4 發(fā)布之后,ChatGPT 甚至可以看懂一些梗圖,并解釋「!乖谀。但 GPT-4 升級(jí)遠(yuǎn)不止如此。
美國(guó)當(dāng)?shù)貢r(shí)間 3 月 14 日,OpenAI 正式發(fā)布了多模態(tài)大型語(yǔ)言模型 GPT-4。OpenAI 在介紹中表示,雖然 GPT-4 在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類(lèi),但在各種專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類(lèi)水平的表現(xiàn)。
與 ChatGPT 發(fā)布之初基于的 GPT-3.5 大模型相比,OpenAI 宣稱(chēng) GPT-4 擁有更強(qiáng)的語(yǔ)言理解能力,在準(zhǔn)確度上有了顯著提升,雖然還無(wú)法解決「胡說(shuō)八道」的問(wèn)題,但出現(xiàn)概率已經(jīng)降低了 60%。
此外,GPT-4 的訓(xùn)練語(yǔ)料庫(kù)還停留在 2021 年 9 月之前,但對(duì)科學(xué)、醫(yī)學(xué)、法律等特定領(lǐng)域進(jìn)行了知識(shí)面的擴(kuò)充,不僅能在美國(guó)統(tǒng)一律師資格考試中取得前列成績(jī),在奧賽、GRE 等考試均取得了很高的分?jǐn)?shù),甚至 SAT 成績(jī)——可以理解為美國(guó)高考成績(jī)——已經(jīng)超過(guò)了 90%的考生,跨過(guò)哈佛、斯坦福等名校的門(mén)檻。
部分考試成績(jī),圖/OpenAI
同時(shí) GPT-4 的其中一個(gè)重點(diǎn)升級(jí)是增加了對(duì)圖片輸入的支持,有了對(duì)圖片進(jìn)行總結(jié)和評(píng)論的能力。在官方示例中,GPT-4 就針對(duì)去年熱傳的一組圖片進(jìn)行了解讀,并指出其中的「笑點(diǎn)」。
機(jī)翻,圖/OpenAI
Twitter 上還有用戶(hù)獲得圖片輸入測(cè)試資格展示了,GPT-4 如何根據(jù)冰箱里剩下的食材推薦今日菜譜。不僅是人類(lèi)的黑話(huà)被 ChatGPT「破譯」了,ChatGPT 也第一次「觸碰」到了現(xiàn)實(shí)世界,讓 ChatGPT 未來(lái)在更多場(chǎng)景的使用成為了可能。
但需要一提的是,目前圖像識(shí)別功能還處于測(cè)試階段,暫時(shí)不公開(kāi)使用,僅限部分客戶(hù)公司和研究人員使用。但除此之外,GPT-4 的所有升級(jí)都已經(jīng)面向 ChatGPT Plus 用戶(hù)和部分 ChatGPT API(應(yīng)用程序接口)全面開(kāi)放。
不過(guò),GPT-4 相比 GPT-3.5 到底帶來(lái)了多大的進(jìn)步,又可能會(huì)掀起什么樣的風(fēng)暴,以及中國(guó)的 ChatGPT——特別是即將在 3 月 16 日發(fā)布的百度文心一言,還有趕超的機(jī)會(huì)嗎?
GPT-4 大大大升級(jí)
在 OpenAI 發(fā)布 GPT-4 的直播中,第一個(gè)介紹的就是對(duì)更長(zhǎng)內(nèi)容的支持——可以直接讀取的 token 數(shù)從 4096 個(gè)(GPT-3.5)升級(jí)到了 32000 個(gè),約等于可以一次性輸入 25000 個(gè)英文單詞。
很多普通用戶(hù)可能用不上也不理解這項(xiàng)升級(jí)的重大意義,但大幅增長(zhǎng)的上下文長(zhǎng)度將極大擴(kuò)展 ChatGPT 的推理能力和用例數(shù)量,比如可以將患者的全部病史一并輸入,或是將冗長(zhǎng)的法律合同輸入,都能減少 ChatGPT 對(duì)前后分開(kāi)內(nèi)容的「誤讀」,提高輸出內(nèi)容的準(zhǔn)確性和實(shí)用性。
OpenAI 也提到,簡(jiǎn)單聊天中 GPT-4 升級(jí)并不明顯(不包括圖片輸入支持),但當(dāng)任務(wù)的復(fù)雜度達(dá)到足夠的閾值,GPT-4 將體現(xiàn)出遠(yuǎn)比 GPT-3.5 更可靠、更有創(chuàng)造力的表現(xiàn)。
此外,ChatGPT 在 GPT-4 大模型的加持下,不僅能夠生成更具說(shuō)服力和吸引力的內(nèi)容,還支持更個(gè)性化的需求和聊天風(fēng)格。官方示例就展示了「蘇格拉底」風(fēng)格設(shè)定下的 GPT-4 老師是如何調(diào)教人類(lèi)學(xué)生,一步一步思考并解出方程組「3x + 2y = 7, 9x -4y = 1」的正確答案。
GPT-4,圖/OpenAI
如果對(duì)比下基于 GPT-3.5 的 ChatGPT 就能明白它們之間的差距。
我們將同樣的設(shè)定和問(wèn)題輸入 ChatGPT(GPT-3.5),它不僅沒(méi)有表現(xiàn)出「蘇格拉底」循循善誘的教導(dǎo),反而直接給出了推導(dǎo)過(guò)程——答案還是錯(cuò)誤的「x=23/27,y=22/9」。
ChatGPT(GPT-3.5),圖/OpenAI
從過(guò)程到結(jié)果,GPT-4 至少在教導(dǎo)人類(lèi)解方程式這件事上吊打了 GPT-3.5,甚至可以說(shuō)已經(jīng)很接近人類(lèi)老師的教導(dǎo)過(guò)程。甚至我們可以想象,GPT-4 如果充分學(xué)習(xí)了魯迅的資料,或許賽博「魯迅」老師也可以成為所有人的語(yǔ)文老師,甚至是終身導(dǎo)師。
這也引出了另一個(gè)升級(jí)重點(diǎn)——不同語(yǔ)言的能力。OpenAI 官方承認(rèn),GPT 不管從語(yǔ)料庫(kù)、基準(zhǔn)測(cè)試、開(kāi)發(fā)人員都是以英文為主,故而對(duì)英文的理解和輸出能力都勝過(guò)其他語(yǔ)言。
但即便如此,在 GPT-4 下,包括中文在內(nèi)的大部分語(yǔ)言處理能力基本都超過(guò)了 GPT-3.5 的英文處理能力。中國(guó)版 ChatGPT 的壓力更大了。
不過(guò),盡管 GPT-4 的能力再一次實(shí)現(xiàn)了驚人的進(jìn)步,包括在對(duì)抗性事實(shí)性評(píng)估中的得分比 GPT-3.5 高出 40%,但還是存在一些「一本正經(jīng)地胡說(shuō)八道」,即 AI 對(duì)事實(shí)產(chǎn)生「幻覺(jué)」,并出現(xiàn)推理錯(cuò)誤。
比如之前 ChatGPT(GPT-3.5)回答并流傳出的「林黛玉三打白骨精」,我們?cè)诨?GPT-4 的 Bing Chat 中也進(jìn)行了測(cè)試,雖然提醒了我們這不是原著中的情節(jié),但同樣「虛造」了改編視頻的存在,這一點(diǎn)可以從引用資料中輕易得出結(jié)論。
圖/必應(yīng)
就如 OpenAI CEO 山姆·阿特曼所說(shuō),GPT-4 仍然存在缺陷,但它有明顯的改進(jìn),相比以前的模型不僅幻覺(jué)減少、偏見(jiàn)減少,還更有創(chuàng)意。
另外據(jù) OpenAI 官網(wǎng)介紹,摩根士丹利、多鄰國(guó)、By My Eyes 等 6 個(gè)企業(yè)客戶(hù)已經(jīng)率先使用了 GPT-4,其中大概也包括微軟。
微軟和 OpenAI 又前進(jìn)了一大步
早在今年 2 月,就有傳聞稱(chēng)微軟將在當(dāng)時(shí)尚未發(fā)布的 Bing 上集成 GPT-4。事實(shí)證明的確如此,Bing 團(tuán)隊(duì)在 GPT-4 正式發(fā)布后就表示:
我們很高興確認(rèn) New Bing 基于 GPT-4 運(yùn)行,這是我們?yōu)樗阉鞫ㄖ频摹H绻谶^(guò)去五周內(nèi)的任何時(shí)間使用過(guò)新版 Bing,那么您已經(jīng)體驗(yàn)過(guò)這個(gè)強(qiáng)大模型的早期版本。隨著 OpenAI 對(duì) GPT-4 及更高版本的更新,Bing Chat 也將從中受益。
事實(shí)上,微軟德國(guó)技術(shù)總監(jiān)也在上周提前透露了 OpenAI 將在本周發(fā)布 GPT-4。而 OpenAI 過(guò)去兩年還與微軟一起從頭設(shè)計(jì)了一臺(tái)專(zhuān)用于語(yǔ)言訓(xùn)練的超級(jí)計(jì)算機(jī),GPT-4 就是跑在這臺(tái)超級(jí)計(jì)算機(jī)上訓(xùn)練出來(lái)的。
再考慮到 2019 年的十億美元投資和今年年初的數(shù)十億美元投資,微軟和 OpenAI 很大程度上已經(jīng)綁為一體。而 GPT-4 的正式推出再次確立了微軟和 OpenAI 在生成式 AI 上的領(lǐng)先,開(kāi)發(fā)者 Pietro Schirano 就表示:「我不在乎它是不是通用人工智能,GPT-4 是一項(xiàng)令人難以置信的變革性技術(shù)!
圖/Twitter
與此同時(shí),ChatGPT 的巨大成功一方面已經(jīng)吸引了大量的商業(yè)應(yīng)用,包括微軟的 Bing Chat,同時(shí)也為微軟 Azure 云計(jì)算平臺(tái)拉來(lái)了大量客戶(hù),為微軟繼續(xù)力挺 OpenAI 進(jìn)行大量的研發(fā)和資金投入提供了充足的條件。
這樣的強(qiáng)強(qiáng)聯(lián)合,國(guó)產(chǎn) ChatGPT 們還有希望嗎?
國(guó)產(chǎn)大模型的差距又被拉大了?
時(shí)至今日,沒(méi)有人會(huì)懷疑 ChatGPT 以及大語(yǔ)言模型的重要性了,包括科技部部長(zhǎng)王志剛也在幾周前重點(diǎn)談到了 ChatGPT,指出就像踢足球都是盤(pán)帶和射門(mén),但要做到梅西那么好很難:
ChatGPT 在技術(shù)進(jìn)步上,特別是保證算法的實(shí)時(shí)性與算法質(zhì)量的有效性上,非常難。
換句話(huà)說(shuō),開(kāi)發(fā)一個(gè)類(lèi)似 ChatGPT 的對(duì)話(huà)機(jī)器人不難,但要實(shí)現(xiàn) ChatGPT 同等水平的自然語(yǔ)言理解能力以及實(shí)時(shí)性,難度極高。
在國(guó)內(nèi)一眾宣稱(chēng)正在開(kāi)發(fā)類(lèi) ChatGPT 中,只有阿里、騰訊、百度對(duì)大語(yǔ)言模型進(jìn)行了大規(guī)模且長(zhǎng)期的投入,而且百度也是三家之中對(duì)于 AI 傾注心血和時(shí)間最多的一家。可以說(shuō),從技術(shù)實(shí)力上,百度是目前最有希望在大語(yǔ)言模型上追趕 OpenAI 的中國(guó)公司。
日前,百度也已經(jīng)宣布將于 3 月 16 日下午召開(kāi)文心一言發(fā)布會(huì),如果順利,文心一言將成為國(guó)內(nèi)大公司推出的第一個(gè)類(lèi) ChatGPT 產(chǎn)品。不過(guò)據(jù) WSJ 報(bào)道,百度從年前就在緊鑼密鼓地進(jìn)行類(lèi) ChatGPT 的開(kāi)發(fā),包括春節(jié)假期期間,甚至將原計(jì)劃的支持中英雙語(yǔ)縮減為專(zhuān)注中文。
在算力、資金、技術(shù)等方面都不占優(yōu)勢(shì)的情況下,指望百度一舉追上甚至超越 OpenAI 不現(xiàn)實(shí)。而且隨著谷歌開(kāi)放 PaLM API(5400 億參數(shù)量的業(yè)界頂尖模型),以及 GPT-4 的進(jìn)一步升級(jí),大幅提高了通用版 GPT 的門(mén)檻,留給后來(lái)者的機(jī)會(huì)也越來(lái)越小。
但一方面,不管是 OpenAI 還是谷歌對(duì)中文的重視程度明顯不足,再加上網(wǎng)絡(luò)和法規(guī)等諸多因素,注定很難在國(guó)內(nèi)直接大規(guī)模落地,百度等國(guó)內(nèi)公司如果能在中文上追平甚至超越 OpenAI,也不失為一種可行路徑。
另一方面,圍繞大語(yǔ)言模型和生成式 AI 的商業(yè)模式還有大量的未知,OpenAI 和百度一樣需要不斷地進(jìn)行商業(yè)化嘗試。百度此前宣布包括魅族、攜程、興業(yè)銀行、美通社等 400 多家企業(yè)將首批接入文心一言生態(tài),意圖明顯希望極大地?cái)U(kuò)展生成式 AI 的用戶(hù)群體,除了考慮生態(tài)的建立,可能也是提前搶占中國(guó)更廣泛用戶(hù)的心智。
當(dāng)然,在文心一言真正推出落地之前,很難評(píng)判它的真正實(shí)力和潛力。而且可以預(yù)見(jiàn),文心一言將不可避免地被用來(lái)與 ChatGPT 進(jìn)行對(duì)比,屆時(shí)才是檢驗(yàn)百度在大語(yǔ)言模型和生成式 AI 實(shí)力的時(shí)刻。
題圖來(lái)自 OpenAI
來(lái)源:雷科技
原文標(biāo)題 : ChatGPT升級(jí)后亂殺老師傅,百度文心一言能抗住壓力嗎?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專(zhuān)題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣(mài)
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿(mǎn)
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市