谷歌 VS OpenAI,大模型Gemini有多拼?
前言:
為了與OpenAI和微軟在人工智能領(lǐng)域展開競爭,谷歌采取了果斷的措施。
他們從PaLM 2切換到了Gemini上,并決定將谷歌大腦和DeepMind合并,以進(jìn)一步加強(qiáng)對(duì)大模型的研發(fā)能力。
合并后的Google DeepMind將集兩個(gè)實(shí)驗(yàn)室的力量,全力攻關(guān)Gemini。這充分展示了谷歌在大模型軍備競賽中孤注一擲的心態(tài)。
作者 | 方文三
圖片來源 | 網(wǎng) 絡(luò)
谷歌大模型Gemini正式發(fā)布
近日,谷歌公司宣布推出新型大型語言模型Gemini。
Gemini是一個(gè)多模態(tài)大模型,意味著它可以泛化并無縫地理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。
谷歌表示,Gemini還是他們迄今為止最靈活的模型,能夠高效地運(yùn)行在數(shù)據(jù)中心和移動(dòng)設(shè)備等多類型平臺(tái)上。
Gemini提供的SOTA能力將顯著增強(qiáng)開發(fā)人員和企業(yè)客戶構(gòu)建和擴(kuò)展AI的方式。
Gemini將作為首個(gè)直接在手機(jī)上運(yùn)行的大型模型,應(yīng)用于谷歌Pixel 8 Pro智能手機(jī)和聊天機(jī)器人Bard。
谷歌計(jì)劃通過谷歌云向客戶提供Gemini授權(quán),并將在未來幾個(gè)月內(nèi)將其與其他谷歌服務(wù)產(chǎn)品進(jìn)行集成。
為了比較Gemini與OpenAI的GPT-4的性能,谷歌運(yùn)行了32個(gè)完善的多模態(tài)基準(zhǔn)測(cè)試,結(jié)果顯示Gemini在32項(xiàng)基準(zhǔn)測(cè)試中的30項(xiàng)中均領(lǐng)先于GPT-4。
在MMLU(大規(guī)模多任務(wù)語言理解)測(cè)試中,Gemini首次在MMLU得分率達(dá)到90.0%,成為第一個(gè)在MMLU測(cè)試中超越人類專家的模型。
Gemini包括了三種不同規(guī)模的模型:
①Gemini Ultra為最大、功能最強(qiáng)大的類別,定位為GPT-4的競爭對(duì)手;
②Gemini Pro為中端型號(hào),性能優(yōu)于GPT-3.5,可擴(kuò)展多種任務(wù);
③Gemini Nano則適用于特定任務(wù)和移動(dòng)設(shè)備。
利用移動(dòng)手機(jī)的算力來運(yùn)行生成式AI,而不是通過由大型科技公司運(yùn)營的云端服務(wù)器,這將大大降低運(yùn)營這類系統(tǒng)的成本。
對(duì)于那些希望將私人數(shù)據(jù)限制在設(shè)備上的人來說,這也提供了一層保障。
然后,在面臨有關(guān)宣傳方面可能存在夸大的質(zhì)疑下,谷歌在一篇官方博客文章中,谷歌的回應(yīng)基本上承認(rèn)了。
在實(shí)現(xiàn)演示視頻中所展示的效果時(shí),必須依賴于使用靜態(tài)圖片以及多段提示詞的組合。
以視頻為例,其中展示了向Gemini系統(tǒng)輪流展示拳頭、剪刀手和張開的手掌,而Gemini系統(tǒng)能夠立刻理解這是在玩猜拳游戲。
然而,谷歌在文章中明確指出,只有當(dāng)同時(shí)向Gemini系統(tǒng)展示這三個(gè)手勢(shì),并給予提示這是游戲時(shí),系統(tǒng)才會(huì)得出猜拳游戲的結(jié)論。
從投資者角度來看,至少這是一個(gè)積極的開端。上周四,谷歌的股價(jià)出現(xiàn)了暴漲,市值增加了800億美元。
谷歌 VS OpenAI:從失利的首敗走出來
在今年2月的巴黎活動(dòng)中,谷歌因聊天機(jī)器人Bard的一次失誤,導(dǎo)致市值蒸發(fā)了1000億美元,引發(fā)了外界對(duì)Bard準(zhǔn)確性的擔(dān)憂。
同時(shí),隨著競爭對(duì)手OpenAI推出的ChatGPT以及在必應(yīng)搜索中整合的GPT技術(shù),谷歌在應(yīng)用程序下載量上被超越,人們開始質(zhì)疑谷歌是否在人工智能領(lǐng)域落后于競爭對(duì)手。
其實(shí)谷歌才是提出2017年Transformer模型、為當(dāng)今人工智能領(lǐng)域制定規(guī)則的先行者。
2021年,谷歌推出了1.6萬億參數(shù)的Switch Transformer,強(qiáng)調(diào)稀疏多模態(tài)結(jié)構(gòu)的潛力。
此外,谷歌還提出了Flan-T5模型,通過更多監(jiān)督數(shù)據(jù)降低了模型規(guī)模,比GPT-3模型參數(shù)更少但性能更佳。
測(cè)試結(jié)果顯示,谷歌AI在數(shù)學(xué)問題上表現(xiàn)更佳,但ChatGPT在常識(shí)問題上更準(zhǔn)確。
谷歌在AI領(lǐng)域取得了不少研究進(jìn)展,但尚未將這些成果部署和變現(xiàn),類似于微軟在過去的某些時(shí)期。
這可能是因?yàn)楣雀璧凸懒宋④浐蚈penAI的競爭實(shí)力,或者過于自信于自己在搜索引擎領(lǐng)域的主導(dǎo)地位。
在Sam Altman領(lǐng)導(dǎo)下的OpenAI專注于產(chǎn)品為導(dǎo)向的工作,致力于擴(kuò)展和優(yōu)化模型,主要關(guān)注細(xì)節(jié)精調(diào)方法。
而谷歌則在技術(shù)發(fā)展的方向上始終保持著積極和前瞻的態(tài)度,不過在整體戰(zhàn)略規(guī)劃上卻屢次調(diào)整。
在谷歌[選擇困難癥]期間,OpenAI已經(jīng)完成了對(duì)ChatGPT的訓(xùn)練。
GPT-4 VS Gemini:多模態(tài)的性能優(yōu)勢(shì)凸顯
作為谷歌應(yīng)對(duì)GPT-4的[重要武器],Gemini在32個(gè)多模態(tài)基準(zhǔn)測(cè)試中取得了30個(gè)SOTA(即當(dāng)前最優(yōu)效果)的記錄,凸顯了其在多模態(tài)任務(wù)中的卓越性能。
它是第一個(gè)在MMLU(大規(guī)模多任務(wù)語言理解)測(cè)評(píng)上超越人類專家的模型,其成績達(dá)到了90.0%,相比之下,人類專家的成績?yōu)?9.8%,GPT-4的成績?yōu)?6.4%。
在多選問題、數(shù)學(xué)問題、Python代碼任務(wù)、閱讀等方面,Gemini的性能都超過了此前最先進(jìn)的水平。
與GPT-4相比,谷歌提供的數(shù)據(jù)顯示Gemini Ultra全面超越GPT-4,而Gemini Pro在大多數(shù)指標(biāo)上超越了GPT-3.5。
總體來說,Gemini在運(yùn)算效能和任務(wù)性能方面都展現(xiàn)出了卓越的表現(xiàn),成功應(yīng)對(duì)了GPT-4的挑戰(zhàn)。
Gemini模型最初強(qiáng)調(diào)了其生成文本和圖像的能力,以與GPT-4區(qū)分開來。
具體而言,Gemini可以理解正式和非正式語言之間的差異,捕捉文本的語氣和情感,并識(shí)別其他文本或來源的引用和暗示。
現(xiàn)在,兩者之間的關(guān)鍵差異可能在于谷歌豐富的專有訓(xùn)練數(shù)據(jù)集。
Gemini能夠處理來自各種服務(wù)(包括Google搜索、YouTube、Google Books和Google Scholar等)的數(shù)據(jù)。
這些服務(wù)包含了來自不同領(lǐng)域和語言的大量豐富信息,有助于Gemini從各種來源和語境中學(xué)習(xí)。
Gemini的培訓(xùn)數(shù)據(jù)量是GPT-4的兩倍,這可能使其在從數(shù)據(jù)集中產(chǎn)生更復(fù)雜的見解和推斷方面具有優(yōu)勢(shì)。
當(dāng)然GPT-4也有其獨(dú)特的優(yōu)勢(shì),GPT-4作為OpenAI開發(fā)的大語言模型,在語言理解和生成方面具有很強(qiáng)的能力。
GPT-4采用Transformer架構(gòu)和無監(jiān)督學(xué)習(xí)技術(shù),能捕捉長距離依賴關(guān)系和上下文信息,展現(xiàn)出卓越的語言理解和生成能力。
此外,GPT-4還具有強(qiáng)大的推理能力,適應(yīng)各種復(fù)雜場景并提供更智能高效的服務(wù)。
結(jié)尾:
與OpenAI的方法不同,谷歌從一開始就構(gòu)建了一個(gè)多感官模型。
多模態(tài)是生成式AI下一步的重點(diǎn)方向,有待繼續(xù)探索的應(yīng)用場景非常廣泛。
下一階段的重點(diǎn)攻克方向是多模態(tài)技術(shù)。
短期來看,Gemini的發(fā)布將進(jìn)一步激發(fā)市場對(duì)多模態(tài)模型的期待,對(duì)產(chǎn)業(yè)而言,多模態(tài)將帶動(dòng)算力需求的提升。
中長期來看,預(yù)計(jì)多模態(tài)模型的升級(jí)將豐富相關(guān)產(chǎn)品的使用場景,疊加硬件升級(jí)、算法優(yōu)化帶來的成本優(yōu)化,2C產(chǎn)品的進(jìn)展值得期待。
部分資料參考:機(jī)器之心:《谷歌大殺器終于來了,最大規(guī)模Gemini震撼發(fā)布》,甲子光年:《優(yōu)等生歸來,谷歌最強(qiáng)大模型Gemini能否打敗GPT4?》,財(cái)經(jīng)E法:《Gemini發(fā)布僅一天就遭質(zhì)疑,谷歌追趕OpenAI太過心急?》
原文標(biāo)題 : 熱點(diǎn)丨谷歌 VS OpenAI,大模型Gemini有多拼?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市