AMD英偉達(dá)“戰(zhàn)火”升級(jí)!發(fā)布世界最強(qiáng)芯片瞄準(zhǔn)英偉達(dá)AI“王座”
隨著AI大模型的興起和各類(lèi)應(yīng)用的層出不窮,以GPU為代表的算力芯片供不應(yīng)求、交期拉長(zhǎng),英偉達(dá)也當(dāng)仁不讓地被推向了“算力霸主”的王座。今年以來(lái),其股價(jià)已上漲160%,市值一度突破萬(wàn)億美元,相當(dāng)于四個(gè)AMD、七個(gè)英特爾。
然而,作為AI的基礎(chǔ)設(shè)施,算力芯片環(huán)節(jié)的“一家獨(dú)大”顯然不是有利于行業(yè)長(zhǎng)遠(yuǎn)發(fā)展的生態(tài)。因此,市場(chǎng)不免將更多的期待寄托于GPU“二號(hào)玩家”AMD身上,而AMD也早早將目標(biāo)瞄向英偉達(dá)的AI王座。AMD究竟有幾分勝算?想窺得這個(gè)問(wèn)題的答案,讓我們將目光移向它的發(fā)布會(huì)上一探究竟。
當(dāng)?shù)貢r(shí)間12月6日消息,AMD在美國(guó)圣何塞舉辦的“Advancing AI”活動(dòng)中宣布,將推出全新的AI芯片系列Instinct MI300,包括MI300A和MI300X等型號(hào),以及相應(yīng)的軟件和服務(wù)。MI300A已經(jīng)開(kāi)始量產(chǎn),而MI300X則已經(jīng)開(kāi)始發(fā)貨。英偉達(dá)在AI這一新興市場(chǎng)的主導(dǎo)地位或?qū)⑹艿絿?yán)重挑戰(zhàn)!
MI 300X芯片是適用于各種各樣生成式AI應(yīng)用場(chǎng)景的芯片;MI 300A則更適用于用在HPC 應(yīng)用和數(shù)據(jù)中心上。
在硬件參數(shù)配置上,兩顆芯片有共性也有差異。
MI300A 與 MI300X 采用相同的基本設(shè)計(jì)和方法,兩顆芯片都采用采用了一種名為“3.5D封裝“的技術(shù)來(lái)生產(chǎn),并且也都是基于 AMD第四代的Infinity架構(gòu)打造。
在內(nèi)存方面,兩顆芯片都采用了現(xiàn)下大熱的HBM 3設(shè)計(jì),但是MI 300A用的是 128GB的 HBM 3設(shè)計(jì),MI 300X 用的是內(nèi)存更大的 192GB HBM 3設(shè)計(jì);
在計(jì)算單元方面,MI 300X 搭載了304個(gè)CDNA 3 計(jì)算單元,每個(gè)計(jì)算單元中還有34個(gè)計(jì)算單位。而MI 300A的計(jì)算單元更少,只有228個(gè)。
在發(fā)布會(huì)上,AMD幾乎全程硬剛英偉達(dá),MI300x 全程“拉踩”H100。
據(jù)AMD稱(chēng),在最常見(jiàn)的大型語(yǔ)言模型內(nèi)核的性能方面,MI300X比H100略快。
但是,盡管AMD表示,該芯片為大型語(yǔ)言模型提供了相同的訓(xùn)練性能,但與競(jìng)爭(zhēng)對(duì)手相比,其改進(jìn)的內(nèi)存能力將節(jié)省大量成本。
““這是世界上性能最高的生成式人工智能加速器,”AMD首席執(zhí)行官蘇姿豐在演講中談到MI300X時(shí)說(shuō)。
Instinct MI300X 基于 CDNA 3 架構(gòu),這是 AMD 的第三代 GPU 架構(gòu),專(zhuān)為數(shù)據(jù)中心的 AI 和 HPC 工作負(fù)載而構(gòu)建。
但是,盡管AMD在MI300A的HPC和AI融合中更加重視工作負(fù)載,但該公司認(rèn)為MI300X在大型語(yǔ)言模型(如Meta的開(kāi)源Llama 2系列)上訓(xùn)練和運(yùn)行推理方面將具有更大的吸引力。
它配備了 192GB 的 HBM3 高帶寬內(nèi)存,是 2022 年英偉達(dá) H100 SXM GPU 的 80GB HBM3 容量的 2.4 倍。它也高于英偉達(dá)最近宣布的H200的141GB HBM3e容量,后者將于明年第二季度上市。雖然 MI300X 參數(shù)上不如英偉達(dá)最新產(chǎn)品 H200,但由于 H200 的出貨時(shí)間比較晚,因此 MI300X 仍被認(rèn)為是對(duì)當(dāng)前算力市場(chǎng)的有力補(bǔ)充。
MI300X 的內(nèi)存帶寬為 5.3 TB/s,比 H100 的 3.3 TB/s 容量高出 60%,也比 H100 的 4.8 TB/s 容量高。
但是,雖然 H100 的 SXM 外形尺寸需要 700 瓦的功率,但 MI300X 的要求略高,功率范圍為 750 瓦。
在HPC性能方面,AMD表示,MI300X可以通過(guò)雙精度浮點(diǎn)數(shù)學(xué)(也稱(chēng)為FP64)實(shí)現(xiàn)高達(dá)163.4 teraflops的矩陣運(yùn)算。對(duì)于 FP64 矢量運(yùn)算,芯片可以達(dá)到 81.7 teraflops。這些數(shù)字比 英偉達(dá) 的 H100 增加了 2.4。
對(duì)于單精度浮點(diǎn)數(shù)學(xué)(也稱(chēng)為 FP32),MI300X 的矩陣和矢量運(yùn)算都可以達(dá)到 163.4 teraflops。據(jù)AMD稱(chēng),該芯片的矢量性能是H100所能達(dá)到的2.4倍。它補(bǔ)充說(shuō),H100 無(wú)法進(jìn)行 FP32 張量運(yùn)算,因此矩陣運(yùn)算沒(méi)有可比性。
至于關(guān)鍵的人工智能性能指標(biāo),AMD表示,MI300X比H100快30%,用于TensorFloat-32或TF32(653.7 teraflops)、半精度浮點(diǎn)或FP16(1307.4 teraflops)、大腦浮點(diǎn)或BFLOAT16(1307.4 teraflops)、8位浮點(diǎn)或FP8(2614.9 teraflops)和8位整數(shù)或INT8(2614.9 teraflops)。
據(jù)AMD稱(chēng),在最常見(jiàn)的大型語(yǔ)言模型內(nèi)核的性能方面,MI300X比H100略快。
對(duì)于 Meta 的 700 億參數(shù) Llama 2 模型的內(nèi)核,MI300x 的中型內(nèi)核快 20%,大內(nèi)核快 10%。對(duì)于 Flash Attention 2,MI300X 在中型內(nèi)核上快 10%,在大內(nèi)核上快 20%。
““這意味著內(nèi)核級(jí)別的性能實(shí)際上直接轉(zhuǎn)化為更快的結(jié)果,”蘇姿豐說(shuō)。
AMD 沒(méi)有透露新品的定價(jià),但 CEO 蘇姿豐聲稱(chēng)比市場(chǎng)上的其它產(chǎn)品有更高的性價(jià)比,目前已向眾多 OEM 合作伙伴發(fā)貨。
微軟首席技術(shù)官 Kevin Scott 作為發(fā)布會(huì)的演講嘉賓宣布,MI300X 已經(jīng)部署到 Azure 當(dāng)中,Azure ND MI300X 虛擬機(jī)現(xiàn)已推出預(yù)覽版。 Meta 還宣布將在其數(shù)據(jù)中心部署 MI300 處理器。另外,惠普、戴爾、聯(lián)想等數(shù)家數(shù)據(jù)中心基礎(chǔ)設(shè)施提供商,也宣布將計(jì)劃在其產(chǎn)品集成MI300。
此前,AMD 預(yù)計(jì) AI 芯片將在新財(cái)季帶來(lái) 4 億美元增收,收入在明年將超過(guò) 20 億美元。作為對(duì)比,英偉達(dá)的數(shù)據(jù)中心硬件在最新財(cái)季的收入為 145 億美元,高于去年同期的 38 億美元。
在發(fā)布會(huì)上,AMD董事長(zhǎng)蘇姿豐表示,預(yù)計(jì)到2027年,用于數(shù)據(jù)中心的人工智能芯片的整體市場(chǎng)規(guī)模將達(dá)到4000億美元,年復(fù)合增長(zhǎng)率將達(dá)到 70%。
在AI這一新興領(lǐng)域中,英偉達(dá)已占得先機(jī)。而AMD不甘示弱,手握著其“終極武器”,勢(shì)必要在算力芯片領(lǐng)域掀起一場(chǎng)“腥風(fēng)血雨”,究竟能否打敗英偉達(dá),登上AI“王座”?讓我們拭目以待。
- END -發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專(zhuān)題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣(mài)
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市