侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

親歷中國智駕大戰(zhàn),吳新宙加入NVIDIA半年后首秀

‍作者 |張祥威

編輯 |德新

吳新宙近日現(xiàn)身NVIDIA GTC,這是其從小鵬汽車離開加入NVIDIA之后的首次公開亮相。

吳目前擔(dān)任NVIDIA汽車事業(yè)部副總裁,全面負(fù)責(zé)NVIDIA的車載計(jì)算產(chǎn)品線DRIVE平臺(tái)的產(chǎn)品定義以及工程落地工作。吳新宙最廣為人知的經(jīng)歷,是在中國市場與小鵬汽車一起打造彼時(shí)最強(qiáng)的智駕系統(tǒng),可以說是推動(dòng)智駕量產(chǎn)數(shù)一數(shù)二的領(lǐng)軍人物。

在GTC的現(xiàn)場,吳新宙發(fā)表了題為《加速向AI定義汽車時(shí)代轉(zhuǎn)變》的演講,介紹了NVIDIA對于AI以及汽車變革的思考

汽車如何從軟件定義汽車向AI定義汽車轉(zhuǎn)變?

未來的自動(dòng)駕駛技術(shù)棧如何變成端到端的范式?

如何真正打造能夠長時(shí)間連續(xù)決策的智能汽車

在吳新宙看來,自動(dòng)駕駛的研發(fā)重心將向云端轉(zhuǎn)移,隨著軟件定義汽車的成熟,以及要解決更多的Corner Case,自動(dòng)駕駛會(huì)迎來新的開發(fā)范式。生成式AI和LLM,將有可能解決這些更復(fù)雜的問題,打造一個(gè)真正類人的高階自動(dòng)駕駛技術(shù)棧。

以下是吳新宙在GTC上的演講,HiEV做了不改變原意的刪減:

一、三大趨勢重新定義汽車

歡迎大家參加NVIDIA GTC的DRIVE開發(fā)者日。

我是吳新宙,擔(dān)任NVIDIA汽車事業(yè)部副總裁。我是最近在6個(gè)月前加入的NVIDIA,負(fù)責(zé)整個(gè)汽車業(yè)務(wù)部門,主要職責(zé)是為Drive平臺(tái)制定產(chǎn)品定義,以及做好相應(yīng)的工程落地。

今天,我將談?wù)?strong>「AI定義汽車」,這一不可逆轉(zhuǎn)的未來趨勢,以及NVIDIA在這一領(lǐng)域正在做什么,從而加速向人工智能定義車輛的轉(zhuǎn)變。

按照議程,首先我將談一談我們的發(fā)展歷程,以及驅(qū)動(dòng)下一波創(chuàng)新并將其應(yīng)用于AI定義汽車的主要因素是什么,之后是NVIDIA在這個(gè)領(lǐng)域做了什么。

過去十年的汽車行業(yè)發(fā)生著諸多令人驚嘆的變化,也許是百年汽車業(yè)未曾見過的。我認(rèn)為,過去10年,三大趨勢對汽車行業(yè)進(jìn)行了重新定義。

第一,電動(dòng)化。為了建設(shè)一個(gè)更清潔、更環(huán)保的世界,汽車行業(yè)已經(jīng)采取措施引入越來越多的電動(dòng)汽車。這里有一些數(shù)據(jù),我認(rèn)為總體預(yù)測來看,到2030年在全球范圍內(nèi)的新能源滲透率將在20% - 30%之間。

但在中國,今年3月份的新能源車滲透率將超過50%,是一個(gè)令人印象深刻的里程碑。

第二,智能化。這一點(diǎn)也非常重要,基本上是為座艙和自動(dòng)駕駛引入更智能的能力,本質(zhì)上是對人類出行的輔助。

我們都知道摩爾定律,Jensen也談到加速計(jì)算是如何定義摩爾定律。汽車行業(yè)很好地代表了這種,超級摩爾定律在過去十年中帶來了諸多迅速的變化。

就NVIDIA而言,我們的第一個(gè)產(chǎn)品是Tegra Parker,然后又推出了25 TOPS的Xavier。在那之前,市場上的產(chǎn)品都是2 TOPS級別。當(dāng)我們推出Orin X時(shí),與Xavier相比,算力又?jǐn)U大了10倍。

今天我將談?wù)勏乱淮脚_(tái),也是最新一代的為汽車而生的超級計(jì)算機(jī),大概是Orin X的4到5倍。

我們每兩年都會(huì)看到,在汽車的計(jì)算需求尤其是自動(dòng)駕駛方面,會(huì)有10倍的增長。

眾所周知,自動(dòng)駕駛處于進(jìn)行時(shí),我有一些中國市場的經(jīng)驗(yàn)。今天在中國,如果一輛車沒有一些先進(jìn)的ADAS功能就很難賣出去。例如,像華為這樣的頭部品牌,選配與不選配高階智駕功能的比例,基本是4:1。

這說明,ADAS能幫人開車,緩解駕駛焦慮和疲勞,我認(rèn)為這股浪潮最終會(huì)在全球范圍內(nèi)發(fā)生,我們將在未來十年看到,對汽車智能化功能的需求越來越多。

第三,OTA能力。購買可以O(shè)TA的車,意味著買車不是買硬件,而是買服務(wù)。買完車后,它在持續(xù)學(xué)習(xí)、進(jìn)化,不斷獲得新功能。今天擁有一輛能進(jìn)化的汽車,是非常令人興奮的。

這就是今天的現(xiàn)狀。

二、邁向「AI定義汽車時(shí)代」

我認(rèn)為下一個(gè)趨勢,也正是我的GTC的演講主題,就是我們正在從軟件定義汽車走向AI定義汽車。

有三個(gè)因素推動(dòng)了這一趨勢的發(fā)展:

第一,對于幾乎所有主機(jī)廠而言,隨著軟件定義汽車逐漸成熟,甚至幾乎每輛車都可以變得非常舒適,軟件定義汽車已經(jīng)無處不在。

第二,自動(dòng)駕駛堆棧的演變,從一個(gè)經(jīng)典的堆棧開始,然后我們使用AI來增強(qiáng)感知的組件,它會(huì)進(jìn)入一個(gè)端到端的自動(dòng)駕駛模型的堆棧。

實(shí)際上在最近,讓所有人驚訝的是,這種情況發(fā)生得如此之快,而且還在持續(xù)發(fā)生。

這就是生成式AI。有了Transformer、LLM、VLM和穩(wěn)定擴(kuò)散,我們看到了很多基于生成式AI的驚人的基本能力和新能力。與我們熟悉的基于卷積的人工智能相比有本質(zhì)區(qū)別,它實(shí)際上是關(guān)于在空間和時(shí)間上創(chuàng)造交叉注意力的能力。

為什么這很重要呢?

卷積網(wǎng)絡(luò)仍然是基于接近度的,試圖找到特征,查詢特征,空間或時(shí)間,顯然我們使用的是IM類型的時(shí)間結(jié)論。但有了Transformer,我們可以獲得圖像中任何兩個(gè)像素在時(shí)間和空間上的相關(guān)性,這將大大增強(qiáng)我們理解復(fù)雜事物的能力。與時(shí)態(tài)相同的是,具有注意力交叉的能力。

現(xiàn)在我們可以進(jìn)行長期推理了,這是一個(gè)非常困難的問題,人工智能幾十年來要實(shí)現(xiàn)的目標(biāo),是能夠跨時(shí)間,也就是跨秒、跨分鐘甚至跨小時(shí)進(jìn)行推理。有了LLM,我們已經(jīng)證明網(wǎng)絡(luò)能夠在整個(gè)人類文學(xué)中進(jìn)行訓(xùn)練,這是一個(gè)非常重要的突破,如今,我們又在目睹AI在視頻領(lǐng)域的突破。

我想說的第三件事,那就是訓(xùn)練的能力,擁有基礎(chǔ)設(shè)施和計(jì)算機(jī)能力,能夠通過大量數(shù)據(jù)進(jìn)行訓(xùn)練。

我認(rèn)為這是另一件非常重要的事情,這無關(guān)生成式AI,而是我們存在的基石,大家知道人工智能是如何迅速地向我們走來的。

三、自動(dòng)駕駛的開發(fā)重心向云端轉(zhuǎn)移

那么,以上這些對自動(dòng)駕駛堆棧意味著什么呢?

正如我所說,自動(dòng)駕駛從一個(gè)經(jīng)典的或基于規(guī)則算法的堆棧開始。

然后是AI增強(qiáng)堆棧。我們首先使用卷積基礎(chǔ)網(wǎng)絡(luò)進(jìn)行感知,然后使用基于Transformer的網(wǎng)絡(luò)進(jìn)行感知BEV的體現(xiàn)。現(xiàn)在,這一趨勢也正體現(xiàn)在規(guī)劃中。

即使在某種意義上有這兩種功能,基本上仍然存在來自當(dāng)前堆棧體系結(jié)構(gòu)的相當(dāng)多的限制。

我把它們分為三類。

第一,堆棧,我們試圖做的是真正量化人類的駕駛行為。這是什么意思?有一個(gè)模塊叫做行為規(guī)劃。相信你們中的許多人都在做自動(dòng)駕駛,所以這個(gè)概念對這里的許多觀眾來說應(yīng)該不是什么新鮮事。

對于行為規(guī)劃,它實(shí)際上是試圖定義一些行為,然后建立一個(gè)狀態(tài)機(jī)來在它們之間轉(zhuǎn)換,基于不同的條件,例如,LCC,一種車道居中控制。

然后我們開始引入變道,你可以認(rèn)為這是另一種模式。

在城市里,這一兩種行為并不能解決問題。

所以,最終人們會(huì)引入幾十種不同的行為。例如,當(dāng)變道時(shí),如果知道相鄰車道有車不讓你這樣做,你會(huì)在車道上停留一段時(shí)間,直到觀察清楚對方要做什么,然后采取下一步行動(dòng)。

所以,為了更好地進(jìn)行行為規(guī)劃,一個(gè)好的堆棧會(huì)引入越來越多的行為,讓它變得越來越像人,但發(fā)現(xiàn)在這種看似像人的行為背后,它仍然是一組離散的行為,系統(tǒng)在它們之間轉(zhuǎn)換。

這實(shí)際上并不聰明,因?yàn)榧词箤τ谧钕冗M(jìn)的堆棧,有時(shí)你仍然會(huì)覺得這是非人駕駛,對吧?因?yàn)槲覀兒茈y量化人的行為。

第二,這也是眾所周知的,受限的泛化能力。我們在很大程度上依賴于數(shù)據(jù)標(biāo)注的數(shù)據(jù)集,尤其是我們看到和理解基本復(fù)雜事物的能力非常有限。如果該數(shù)據(jù)未被學(xué)習(xí)和訓(xùn)練,則對其進(jìn)行標(biāo)注。我們應(yīng)該引入基礎(chǔ)模型,我會(huì)在下面的PPT中進(jìn)行更多討論。

第三,在自動(dòng)駕駛堆棧中做出連貫的長期決策的能力,這是非常困難的,因?yàn)檫@個(gè)堆棧的大部分,我們現(xiàn)在擁有的堆棧,它仍然是一種瞬態(tài)的內(nèi)存系統(tǒng),我有時(shí)把它描述為一條魚7秒的記憶,這就是堆棧的現(xiàn)狀。

在很多方面,對于一個(gè)真正類人的高階自動(dòng)駕駛堆棧,需要更多的功能。我們中間的許多人可能都有在機(jī)場找租車還車處或在機(jī)場找停車場的糟糕記憶。你目標(biāo)很簡單,但你知道,通常導(dǎo)航不會(huì)馬上把你帶到那里,或者機(jī)場正在施工,你必須依靠你所看到的現(xiàn)狀,并努力在幾十分鐘內(nèi)做出一致的決定,找到合適的路徑,這種能力一直是人工智能的一大限制。

有了生成式AI和LLM,我認(rèn)為我們將能夠解決這樣復(fù)雜的問題,我們將能夠制造一個(gè)機(jī)器人或一輛可以長時(shí)間做出連續(xù)決策的人工智能汽車。

簡言之,我們所做的事情有一些局限性。即使目前的第一塊和第二塊取得了非凡的成就,但隨著生成式AI的新能力,天花板會(huì)更高。

什么是AI定義汽車?

基本上,我們在未來看到的是模型,自動(dòng)駕駛堆棧將成為端到端的模型,它將在具有大量數(shù)據(jù)的云中進(jìn)行訓(xùn)練。更重要的是,它還將在具有模擬能力的云中進(jìn)行驗(yàn)證。NVIDIA在Omniverse和Drive Sim上的投入已有多年,我認(rèn)為仿真的黃金時(shí)段已經(jīng)到來,但在未來會(huì)更加重要。

有了仿真功能和端到端大模型,你可以發(fā)現(xiàn),自動(dòng)駕駛的開發(fā)重心將進(jìn)入云端,而不是讓龐大的工程師和龐大的車隊(duì)在路上行駛,F(xiàn)在,您需要云計(jì)算中的大型服務(wù)器,這對NVIDIA來說是好事,我們正在實(shí)現(xiàn)這一點(diǎn)。這就是未來的道路。

很明顯,在車輛中,我們將進(jìn)行模型部署,在未來,OTA基本上只會(huì)進(jìn)行模型更新,但讓數(shù)據(jù)返回到云中非常重要,以不斷完善云中的大模型。這就是我們所看到的未來。

所以,對于軟件來說,劃分一個(gè)我們所知道的車輛,我已經(jīng)花了10年的時(shí)間來研究它,部署工作真的非常繁重。幾乎所有的組件都需要大量的編碼、工程師和工程,這個(gè)堆棧非常深,在路上找到他們的Corner Case識別確實(shí)需要很多時(shí)間。

L2的ADAS系統(tǒng)不一定是完美無瑕的,但當(dāng)我們朝著L3和L4的方向前進(jìn)時(shí),當(dāng)我們讓人脫手時(shí),基于安全性和Corner Case等要求,識別能力就變得非常重要。

正如我們所了解,Corner Case將變得越來越少,越來越難以識別。我們必須依靠龐大的車隊(duì)才能找到這些Corner Case,但這是一個(gè)非常困難的過程,必須能夠開發(fā)一種非常復(fù)雜的機(jī)制,無論何時(shí)發(fā)生這種事情,都能夠識別或觸發(fā)記錄。

四、從車端到云端,支持生成式AI落地

然后,需要計(jì)算機(jī)、基礎(chǔ)設(shè)施能夠分析,并嘗試在云中解決這些案例,這是一項(xiàng)艱巨的工作。

比如,測試基本上是大規(guī)模的里程覆蓋。所以通常情況下,人們或汽車廠商只愿意在他們測試過的區(qū)域發(fā)布軟件,這是一種常見的做法。意味著用要數(shù)百輛的測試車隊(duì)進(jìn)行數(shù)十萬英里的測試。

你需要一個(gè)非常高效的基礎(chǔ)設(shè)施實(shí)現(xiàn),以便能夠支持測試和數(shù)據(jù)回傳,并使用這些測試數(shù)據(jù)來支持開發(fā),我們稱之為數(shù)據(jù)飛輪

我們希望在AI定義汽車時(shí)代,簡化傳統(tǒng)的大規(guī)模的運(yùn)營和OTA部署工作,讓大量的工程師成為云計(jì)算的巨大力量。我們將大部分訓(xùn)練在云端進(jìn)行,測試將主要在模擬中進(jìn)行驗(yàn)證,OTA更多是為了大模型。NVIDIA正在做一些事情來實(shí)現(xiàn)這一點(diǎn),那就是加速人工智能時(shí)代定義汽車這一趨勢。

所以,Drive平臺(tái)幾乎是端到端的,從芯片到安全平臺(tái),再到全棧,我的團(tuán)隊(duì)很大一部分工作是開發(fā)Full Stack-NDAS 堆棧和數(shù)據(jù)中心基礎(chǔ)設(shè)施。

我會(huì)快速談一下這些不同的要素。

Thor,這是我們這一代的超級計(jì)算機(jī)。它具有1000 Tops的計(jì)算機(jī)功能,是上一代芯片Orin X的4倍。包括630K DMIPSCPU算力,是Orin X的2.5倍。我們的主機(jī)廠合作伙伴越來越多,包括中國的自動(dòng)駕駛開發(fā)商OEM,包括理想汽車和比亞迪。

我們所做的一個(gè)重要改變是在Thor和Blackwell Hopper中,基本上是FP4,浮點(diǎn)4位,支持計(jì)算機(jī)的操作系統(tǒng)。這實(shí)際上非常重要,因?yàn)楫?dāng)內(nèi)存帶寬限制為4位時(shí)可以進(jìn)行更有效的計(jì)算。

有了這些改進(jìn),就可以實(shí)現(xiàn)4倍于Orin X的提升。通過一些技巧,我們希望基于LLAMA-7B模型實(shí)現(xiàn)9倍的提升,Thor可以原生支持Transformer,相信可以成為支持人工智能的開放Soc。

這就是NVIDIA的Drive平臺(tái),從芯片到云。我們有兩臺(tái)計(jì)算機(jī),一臺(tái)在車?yán)铮硪慌_(tái)在云中。

我們正在做很多工作,比如,在推理芯片和云端芯片中,引入大規(guī)模的生成式AI兼容計(jì)算能力,我們正在非常努力地使這一過程中的每一步都成為安全客戶端。在軟件方面,我們正在引入生成式AI和基礎(chǔ)模型,以填補(bǔ)推理模型和模擬的未來能力。

未來,我們希望Drive是一個(gè)開放的平臺(tái)。如果OEM希望一直合作,我們是非常開放的。如果只是想從我們現(xiàn)有的東西中獲得一部分服務(wù),我們也很樂意與之合作。

我們會(huì)再次看到,汽車的計(jì)算機(jī)將開始引入這種端到端的基于模型的能力。同時(shí),仿真能力也非常重要,我們將努力地實(shí)現(xiàn)像素場景和行為等的保真度。此外,我們還將引入基礎(chǔ)模型作為人工智能模型。謝謝大家。

*文中圖片來自NVIDIA 2024 GTC大會(huì)吳新宙演講

       原文標(biāo)題 : 親歷中國智駕大戰(zhàn),吳新宙加入NVIDIA半年后首秀

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號