親歷中國智駕大戰(zhàn),吳新宙加入NVIDIA半年后首秀
作者 |張祥威
編輯 |德新
吳新宙近日現(xiàn)身NVIDIA GTC,這是其從小鵬汽車離開加入NVIDIA之后的首次公開亮相。
吳目前擔(dān)任NVIDIA汽車事業(yè)部副總裁,全面負(fù)責(zé)NVIDIA的車載計(jì)算產(chǎn)品線DRIVE平臺(tái)的產(chǎn)品定義以及工程落地工作。吳新宙最廣為人知的經(jīng)歷,是在中國市場與小鵬汽車一起打造彼時(shí)最強(qiáng)的智駕系統(tǒng),可以說是推動(dòng)智駕量產(chǎn)數(shù)一數(shù)二的領(lǐng)軍人物。
在GTC的現(xiàn)場,吳新宙發(fā)表了題為《加速向AI定義汽車時(shí)代轉(zhuǎn)變》的演講,介紹了NVIDIA對于AI以及汽車變革的思考:
汽車如何從軟件定義汽車向AI定義汽車轉(zhuǎn)變?
未來的自動(dòng)駕駛技術(shù)棧如何變成端到端的范式?
如何真正打造能夠長時(shí)間連續(xù)決策的智能汽車?
在吳新宙看來,自動(dòng)駕駛的研發(fā)重心將向云端轉(zhuǎn)移,隨著軟件定義汽車的成熟,以及要解決更多的Corner Case,自動(dòng)駕駛會(huì)迎來新的開發(fā)范式。生成式AI和LLM,將有可能解決這些更復(fù)雜的問題,打造一個(gè)真正類人的高階自動(dòng)駕駛技術(shù)棧。
以下是吳新宙在GTC上的演講,HiEV做了不改變原意的刪減:
一、三大趨勢重新定義汽車
歡迎大家參加NVIDIA GTC的DRIVE開發(fā)者日。
我是吳新宙,擔(dān)任NVIDIA汽車事業(yè)部副總裁。我是最近在6個(gè)月前加入的NVIDIA,負(fù)責(zé)整個(gè)汽車業(yè)務(wù)部門,主要職責(zé)是為Drive平臺(tái)制定產(chǎn)品定義,以及做好相應(yīng)的工程落地。
今天,我將談?wù)?strong>「AI定義汽車」,這一不可逆轉(zhuǎn)的未來趨勢,以及NVIDIA在這一領(lǐng)域正在做什么,從而加速向人工智能定義車輛的轉(zhuǎn)變。
按照議程,首先我將談一談我們的發(fā)展歷程,以及驅(qū)動(dòng)下一波創(chuàng)新并將其應(yīng)用于AI定義汽車的主要因素是什么,之后是NVIDIA在這個(gè)領(lǐng)域做了什么。
過去十年的汽車行業(yè)發(fā)生著諸多令人驚嘆的變化,也許是百年汽車業(yè)未曾見過的。我認(rèn)為,過去10年,三大趨勢對汽車行業(yè)進(jìn)行了重新定義。
第一,電動(dòng)化。為了建設(shè)一個(gè)更清潔、更環(huán)保的世界,汽車行業(yè)已經(jīng)采取措施引入越來越多的電動(dòng)汽車。這里有一些數(shù)據(jù),我認(rèn)為總體預(yù)測來看,到2030年在全球范圍內(nèi)的新能源滲透率將在20% - 30%之間。
但在中國,今年3月份的新能源車滲透率將超過50%,是一個(gè)令人印象深刻的里程碑。
第二,智能化。這一點(diǎn)也非常重要,基本上是為座艙和自動(dòng)駕駛引入更智能的能力,本質(zhì)上是對人類出行的輔助。
我們都知道摩爾定律,Jensen也談到加速計(jì)算是如何定義摩爾定律。汽車行業(yè)很好地代表了這種,超級摩爾定律在過去十年中帶來了諸多迅速的變化。
就NVIDIA而言,我們的第一個(gè)產(chǎn)品是Tegra Parker,然后又推出了25 TOPS的Xavier。在那之前,市場上的產(chǎn)品都是2 TOPS級別。當(dāng)我們推出Orin X時(shí),與Xavier相比,算力又?jǐn)U大了10倍。
今天我將談?wù)勏乱淮脚_(tái),也是最新一代的為汽車而生的超級計(jì)算機(jī),大概是Orin X的4到5倍。
我們每兩年都會(huì)看到,在汽車的計(jì)算需求尤其是自動(dòng)駕駛方面,會(huì)有10倍的增長。
眾所周知,自動(dòng)駕駛處于進(jìn)行時(shí),我有一些中國市場的經(jīng)驗(yàn)。今天在中國,如果一輛車沒有一些先進(jìn)的ADAS功能就很難賣出去。例如,像華為這樣的頭部品牌,選配與不選配高階智駕功能的比例,基本是4:1。
這說明,ADAS能幫人開車,緩解駕駛焦慮和疲勞,我認(rèn)為這股浪潮最終會(huì)在全球范圍內(nèi)發(fā)生,我們將在未來十年看到,對汽車智能化功能的需求越來越多。
第三,OTA能力。購買可以O(shè)TA的車,意味著買車不是買硬件,而是買服務(wù)。買完車后,它在持續(xù)學(xué)習(xí)、進(jìn)化,不斷獲得新功能。今天擁有一輛能進(jìn)化的汽車,是非常令人興奮的。
這就是今天的現(xiàn)狀。
二、邁向「AI定義汽車時(shí)代」
我認(rèn)為下一個(gè)趨勢,也正是我的GTC的演講主題,就是我們正在從軟件定義汽車走向AI定義汽車。
有三個(gè)因素推動(dòng)了這一趨勢的發(fā)展:
第一,對于幾乎所有主機(jī)廠而言,隨著軟件定義汽車逐漸成熟,甚至幾乎每輛車都可以變得非常舒適,軟件定義汽車已經(jīng)無處不在。
第二,自動(dòng)駕駛堆棧的演變,從一個(gè)經(jīng)典的堆棧開始,然后我們使用AI來增強(qiáng)感知的組件,它會(huì)進(jìn)入一個(gè)端到端的自動(dòng)駕駛模型的堆棧。
實(shí)際上在最近,讓所有人驚訝的是,這種情況發(fā)生得如此之快,而且還在持續(xù)發(fā)生。
這就是生成式AI。有了Transformer、LLM、VLM和穩(wěn)定擴(kuò)散,我們看到了很多基于生成式AI的驚人的基本能力和新能力。與我們熟悉的基于卷積的人工智能相比有本質(zhì)區(qū)別,它實(shí)際上是關(guān)于在空間和時(shí)間上創(chuàng)造交叉注意力的能力。
為什么這很重要呢?
卷積網(wǎng)絡(luò)仍然是基于接近度的,試圖找到特征,查詢特征,空間或時(shí)間,顯然我們使用的是IM類型的時(shí)間結(jié)論。但有了Transformer,我們可以獲得圖像中任何兩個(gè)像素在時(shí)間和空間上的相關(guān)性,這將大大增強(qiáng)我們理解復(fù)雜事物的能力。與時(shí)態(tài)相同的是,具有注意力交叉的能力。
現(xiàn)在我們可以進(jìn)行長期推理了,這是一個(gè)非常困難的問題,人工智能幾十年來要實(shí)現(xiàn)的目標(biāo),是能夠跨時(shí)間,也就是跨秒、跨分鐘甚至跨小時(shí)進(jìn)行推理。有了LLM,我們已經(jīng)證明網(wǎng)絡(luò)能夠在整個(gè)人類文學(xué)中進(jìn)行訓(xùn)練,這是一個(gè)非常重要的突破,如今,我們又在目睹AI在視頻領(lǐng)域的突破。
我想說的第三件事,那就是訓(xùn)練的能力,擁有基礎(chǔ)設(shè)施和計(jì)算機(jī)能力,能夠通過大量數(shù)據(jù)進(jìn)行訓(xùn)練。
我認(rèn)為這是另一件非常重要的事情,這無關(guān)生成式AI,而是我們存在的基石,大家知道人工智能是如何迅速地向我們走來的。
三、自動(dòng)駕駛的開發(fā)重心向云端轉(zhuǎn)移
那么,以上這些對自動(dòng)駕駛堆棧意味著什么呢?
正如我所說,自動(dòng)駕駛從一個(gè)經(jīng)典的或基于規(guī)則算法的堆棧開始。
然后是AI增強(qiáng)堆棧。我們首先使用卷積基礎(chǔ)網(wǎng)絡(luò)進(jìn)行感知,然后使用基于Transformer的網(wǎng)絡(luò)進(jìn)行感知BEV的體現(xiàn)。現(xiàn)在,這一趨勢也正體現(xiàn)在規(guī)劃中。
即使在某種意義上有這兩種功能,基本上仍然存在來自當(dāng)前堆棧體系結(jié)構(gòu)的相當(dāng)多的限制。
我把它們分為三類。
第一,堆棧,我們試圖做的是真正量化人類的駕駛行為。這是什么意思?有一個(gè)模塊叫做行為規(guī)劃。相信你們中的許多人都在做自動(dòng)駕駛,所以這個(gè)概念對這里的許多觀眾來說應(yīng)該不是什么新鮮事。
對于行為規(guī)劃,它實(shí)際上是試圖定義一些行為,然后建立一個(gè)狀態(tài)機(jī)來在它們之間轉(zhuǎn)換,基于不同的條件,例如,LCC,一種車道居中控制。
然后我們開始引入變道,你可以認(rèn)為這是另一種模式。
在城市里,這一兩種行為并不能解決問題。
所以,最終人們會(huì)引入幾十種不同的行為。例如,當(dāng)變道時(shí),如果知道相鄰車道有車不讓你這樣做,你會(huì)在車道上停留一段時(shí)間,直到觀察清楚對方要做什么,然后采取下一步行動(dòng)。
所以,為了更好地進(jìn)行行為規(guī)劃,一個(gè)好的堆棧會(huì)引入越來越多的行為,讓它變得越來越像人,但發(fā)現(xiàn)在這種看似像人的行為背后,它仍然是一組離散的行為,系統(tǒng)在它們之間轉(zhuǎn)換。
這實(shí)際上并不聰明,因?yàn)榧词箤τ谧钕冗M(jìn)的堆棧,有時(shí)你仍然會(huì)覺得這是非人駕駛,對吧?因?yàn)槲覀兒茈y量化人的行為。
第二,這也是眾所周知的,受限的泛化能力。我們在很大程度上依賴于數(shù)據(jù)標(biāo)注的數(shù)據(jù)集,尤其是我們看到和理解基本復(fù)雜事物的能力非常有限。如果該數(shù)據(jù)未被學(xué)習(xí)和訓(xùn)練,則對其進(jìn)行標(biāo)注。我們應(yīng)該引入基礎(chǔ)模型,我會(huì)在下面的PPT中進(jìn)行更多討論。
第三,在自動(dòng)駕駛堆棧中做出連貫的長期決策的能力,這是非常困難的,因?yàn)檫@個(gè)堆棧的大部分,我們現(xiàn)在擁有的堆棧,它仍然是一種瞬態(tài)的內(nèi)存系統(tǒng),我有時(shí)把它描述為一條魚7秒的記憶,這就是堆棧的現(xiàn)狀。
在很多方面,對于一個(gè)真正類人的高階自動(dòng)駕駛堆棧,需要更多的功能。我們中間的許多人可能都有在機(jī)場找租車還車處或在機(jī)場找停車場的糟糕記憶。你目標(biāo)很簡單,但你知道,通常導(dǎo)航不會(huì)馬上把你帶到那里,或者機(jī)場正在施工,你必須依靠你所看到的現(xiàn)狀,并努力在幾十分鐘內(nèi)做出一致的決定,找到合適的路徑,這種能力一直是人工智能的一大限制。
有了生成式AI和LLM,我認(rèn)為我們將能夠解決這樣復(fù)雜的問題,我們將能夠制造一個(gè)機(jī)器人或一輛可以長時(shí)間做出連續(xù)決策的人工智能汽車。
簡言之,我們所做的事情有一些局限性。即使目前的第一塊和第二塊取得了非凡的成就,但隨著生成式AI的新能力,天花板會(huì)更高。
什么是AI定義汽車?
基本上,我們在未來看到的是模型,自動(dòng)駕駛堆棧將成為端到端的模型,它將在具有大量數(shù)據(jù)的云中進(jìn)行訓(xùn)練。更重要的是,它還將在具有模擬能力的云中進(jìn)行驗(yàn)證。NVIDIA在Omniverse和Drive Sim上的投入已有多年,我認(rèn)為仿真的黃金時(shí)段已經(jīng)到來,但在未來會(huì)更加重要。
有了仿真功能和端到端大模型,你可以發(fā)現(xiàn),自動(dòng)駕駛的開發(fā)重心將進(jìn)入云端,而不是讓龐大的工程師和龐大的車隊(duì)在路上行駛,F(xiàn)在,您需要云計(jì)算中的大型服務(wù)器,這對NVIDIA來說是好事,我們正在實(shí)現(xiàn)這一點(diǎn)。這就是未來的道路。
很明顯,在車輛中,我們將進(jìn)行模型部署,在未來,OTA基本上只會(huì)進(jìn)行模型更新,但讓數(shù)據(jù)返回到云中非常重要,以不斷完善云中的大模型。這就是我們所看到的未來。
所以,對于軟件來說,劃分一個(gè)我們所知道的車輛,我已經(jīng)花了10年的時(shí)間來研究它,部署工作真的非常繁重。幾乎所有的組件都需要大量的編碼、工程師和工程,這個(gè)堆棧非常深,在路上找到他們的Corner Case識別確實(shí)需要很多時(shí)間。
L2的ADAS系統(tǒng)不一定是完美無瑕的,但當(dāng)我們朝著L3和L4的方向前進(jìn)時(shí),當(dāng)我們讓人脫手時(shí),基于安全性和Corner Case等要求,識別能力就變得非常重要。
正如我們所了解,Corner Case將變得越來越少,越來越難以識別。我們必須依靠龐大的車隊(duì)才能找到這些Corner Case,但這是一個(gè)非常困難的過程,必須能夠開發(fā)一種非常復(fù)雜的機(jī)制,無論何時(shí)發(fā)生這種事情,都能夠識別或觸發(fā)記錄。
四、從車端到云端,支持生成式AI落地
然后,需要計(jì)算機(jī)、基礎(chǔ)設(shè)施能夠分析,并嘗試在云中解決這些案例,這是一項(xiàng)艱巨的工作。
比如,測試基本上是大規(guī)模的里程覆蓋。所以通常情況下,人們或汽車廠商只愿意在他們測試過的區(qū)域發(fā)布軟件,這是一種常見的做法。意味著用要數(shù)百輛的測試車隊(duì)進(jìn)行數(shù)十萬英里的測試。
你需要一個(gè)非常高效的基礎(chǔ)設(shè)施實(shí)現(xiàn),以便能夠支持測試和數(shù)據(jù)回傳,并使用這些測試數(shù)據(jù)來支持開發(fā),我們稱之為數(shù)據(jù)飛輪。
我們希望在AI定義汽車時(shí)代,簡化傳統(tǒng)的大規(guī)模的運(yùn)營和OTA部署工作,讓大量的工程師成為云計(jì)算的巨大力量。我們將大部分訓(xùn)練在云端進(jìn)行,測試將主要在模擬中進(jìn)行驗(yàn)證,OTA更多是為了大模型。NVIDIA正在做一些事情來實(shí)現(xiàn)這一點(diǎn),那就是加速人工智能時(shí)代定義汽車這一趨勢。
所以,Drive平臺(tái)幾乎是端到端的,從芯片到安全平臺(tái),再到全棧,我的團(tuán)隊(duì)很大一部分工作是開發(fā)Full Stack-NDAS 堆棧和數(shù)據(jù)中心基礎(chǔ)設(shè)施。
我會(huì)快速談一下這些不同的要素。
Thor,這是我們這一代的超級計(jì)算機(jī)。它具有1000 Tops的計(jì)算機(jī)功能,是上一代芯片Orin X的4倍。包括630K DMIPSCPU算力,是Orin X的2.5倍。我們的主機(jī)廠合作伙伴越來越多,包括中國的自動(dòng)駕駛開發(fā)商OEM,包括理想汽車和比亞迪。
我們所做的一個(gè)重要改變是在Thor和Blackwell Hopper中,基本上是FP4,浮點(diǎn)4位,支持計(jì)算機(jī)的操作系統(tǒng)。這實(shí)際上非常重要,因?yàn)楫?dāng)內(nèi)存帶寬限制為4位時(shí)可以進(jìn)行更有效的計(jì)算。
有了這些改進(jìn),就可以實(shí)現(xiàn)4倍于Orin X的提升。通過一些技巧,我們希望基于LLAMA-7B模型實(shí)現(xiàn)9倍的提升,Thor可以原生支持Transformer,相信可以成為支持人工智能的開放Soc。
這就是NVIDIA的Drive平臺(tái),從芯片到云。我們有兩臺(tái)計(jì)算機(jī),一臺(tái)在車?yán)铮硪慌_(tái)在云中。
我們正在做很多工作,比如,在推理芯片和云端芯片中,引入大規(guī)模的生成式AI兼容計(jì)算能力,我們正在非常努力地使這一過程中的每一步都成為安全客戶端。在軟件方面,我們正在引入生成式AI和基礎(chǔ)模型,以填補(bǔ)推理模型和模擬的未來能力。
未來,我們希望Drive是一個(gè)開放的平臺(tái)。如果OEM希望一直合作,我們是非常開放的。如果只是想從我們現(xiàn)有的東西中獲得一部分服務(wù),我們也很樂意與之合作。
我們會(huì)再次看到,汽車的計(jì)算機(jī)將開始引入這種端到端的基于模型的能力。同時(shí),仿真能力也非常重要,我們將努力地實(shí)現(xiàn)像素場景和行為等的保真度。此外,我們還將引入基礎(chǔ)模型作為人工智能模型。謝謝大家。
*文中圖片來自NVIDIA 2024 GTC大會(huì)吳新宙演講
原文標(biāo)題 : 親歷中國智駕大戰(zhàn),吳新宙加入NVIDIA半年后首秀
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
11月19日立即報(bào)名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 蔡司新能源汽車三電質(zhì)量解決方案
-
精彩回顧立即查看>> 蔡司新能源汽車三電質(zhì)量解決方案
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會(huì)暨展覽會(huì)
-
精彩回顧立即查看>> 【線下會(huì)議】全數(shù)會(huì)2024電子元器件展覽會(huì)
推薦專題
- 1 “作弊器”不靈了?智駕的激光雷達(dá),正在被攝像頭替代
- 2 被逼墻角的Mobileye,祭出 CAIS 大旗,挑戰(zhàn)端到端大模型智能駕駛
- 3 4 激光雷達(dá)與純視覺方案,哪個(gè)才是自動(dòng)駕駛最優(yōu)選?
- 5 激光雷達(dá)即將降價(jià),純視覺回到鄙視鏈底層?
- 6 如何跑贏汽車智能化下半場?
- 7 從小鵬、理想、蔚來布局看自動(dòng)駕駛發(fā)展趨勢
- 8 智能駕駛的百生相,你是該信呢?還是該信呢?
- 9 比亞迪技術(shù)魚池大戰(zhàn)豐田工具箱,誰將主導(dǎo)未來汽車市場?
- 10 全網(wǎng)最詳解! 美國禁止中國智駕究竟包括哪些?
- IE工程師(汽車智聯(lián)) 惠州碩貝德無線科技股份有限公司
- 現(xiàn)場技術(shù)支持工程師(汽車) 易思維(杭州)科技股份有限公司
- 銷售經(jīng)理(汽車新能源行業(yè)) 廣州瑞松智能科技股份有限公司
- 結(jié)構(gòu)工程師-汽車電子事業(yè)部(J10116) 深圳奧尼電子股份有限公司
- 銷售總監(jiān)-汽車電子方向 深圳市智立方自動(dòng)化設(shè)備股份有限公司
- 項(xiàng)目經(jīng)理(汽車內(nèi)飾&汽車電子) 伯恩光學(xué)(惠州)有限公司
- 高級軟件工程師 廣東省/深圳市
- 自動(dòng)化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市