特斯拉自動駕駛強于Waymo的三大理由
商業(yè)分析人士、記者和普通大眾的多數(shù)觀點似乎是,Waymo在自動駕駛方面遙遙領(lǐng)先,特斯拉則遠遠落后。然而當(dāng)你研究神經(jīng)網(wǎng)絡(luò)的基本原理時,就會發(fā)現(xiàn),上述觀點是沒有意義的。
決定深度神經(jīng)網(wǎng)絡(luò)性能好壞有三個因素:訓(xùn)練數(shù)據(jù)、網(wǎng)絡(luò)架構(gòu)、優(yōu)化算法。眾所周知,深度學(xué)習(xí)需要大量的數(shù)據(jù),而大多數(shù)AI領(lǐng)域的工程師,也將大多數(shù)時間花在了訓(xùn)練數(shù)據(jù)上,可見,訓(xùn)練數(shù)據(jù)是深度學(xué)習(xí)問題中最核心的一環(huán)。一般來說,數(shù)據(jù)越多,AI越智能,表現(xiàn)越良好。這也是為什么一部分業(yè)內(nèi)人士認(rèn)為特斯拉優(yōu)于Waymo的根本原因。
擁有約50萬輛汽車的特斯拉車隊,配備了特斯拉聲稱的全自動駕駛硬件,特斯拉車隊每天行駛的里程約為1500萬英里,相當(dāng)于Waymo車隊成立以來行駛的總里程。根據(jù)每天1500萬英里的行駛里程,可以推算出特斯拉每年可以行駛54億英里,比Waymo公司預(yù)計的全年行駛里程高出200倍。值得注意的是,特斯拉的車隊也在以每周約5000輛的驚人速度不斷增長。
這些數(shù)據(jù)主要在以下三個關(guān)鍵領(lǐng)域發(fā)揮重要作用:
計算機視覺
預(yù)測
路徑規(guī)劃/駕駛策略
計算機視覺
目標(biāo)檢測是計算機視覺的一項重要任務(wù)。有些物體,比如馬,很少出現(xiàn)在路上。每當(dāng)特斯拉的汽車遇到神經(jīng)網(wǎng)絡(luò)認(rèn)為可能是馬的東西(或者可能只是一個無法識別的物體擋住了路),攝像頭就會拍下照片,隨后通過WiFi上傳?梢,特斯拉讓車輛每年行駛數(shù)十億英里是有幫助的,因為這樣可以找到更多罕見物體的例子。據(jù)此,可以推斷,隨著時間的推移,特斯拉將比Waymo更善于識別路上的罕見物品。
預(yù)測
預(yù)測是指提前幾秒鐘預(yù)測汽車、行人或騎行者等交通參與者的運動或動作的能力。多年來一直效力Waymo頂尖工程師之一——安東尼萊萬多夫斯基(AnthonyLevandowski)最近稱:如今的軟件不足以預(yù)測未來。Anthony Levandowski稱,根據(jù)數(shù)據(jù)顯示,目前自動駕駛汽車的故障主要是因為錯誤地預(yù)測了周圍的車輛和行人的行為。
目前,特斯拉擁有約50萬輛汽車,這是一個非常優(yōu)越的資源。特斯拉可以利用這50萬輛汽車,實現(xiàn)對“錯誤預(yù)測情況”的采集,將采集到的快照上傳并添加到特斯拉的訓(xùn)練集中。特斯拉還可以上傳一個由其計算機視覺神經(jīng)網(wǎng)絡(luò)生成抽象的場景,而不是上傳一段視頻。這種方式也將從根本上減少上傳該數(shù)據(jù)的帶寬和內(nèi)存需求。
雖然用于訓(xùn)練目標(biāo)檢測的圖像需要人類標(biāo)記,但預(yù)測神經(jīng)網(wǎng)絡(luò)可以僅從事件的時間序列中學(xué)習(xí)過去和未來之間的相關(guān)性。
由于不需要人為數(shù)據(jù)貼上標(biāo)簽,特斯拉可以將其神經(jīng)網(wǎng)絡(luò)訓(xùn)練成盡可能多的有用數(shù)據(jù)。這意味著其訓(xùn)練數(shù)據(jù)集的大小將與其總里程相關(guān)。與對象檢測一樣,與Waymo相比,它的優(yōu)勢不僅在于提供更多的數(shù)據(jù)來預(yù)測常見行為,還在于能夠收集在罕見情況下出現(xiàn)的罕見行為的數(shù)據(jù),從而預(yù)測這些行為。
路徑規(guī)劃/駕駛策略
路徑規(guī)劃和駕駛政策是指汽車在限速時保持在車道中心、變道、超車、綠燈左轉(zhuǎn)、繞過停著的車、停車讓行人過馬路等等行為決策。要制定一套涵蓋汽車在任何情況下可能需要采取的行動的規(guī)則,本身極其困難,這也是國內(nèi)外自動駕駛領(lǐng)域?qū)I(yè)人士一直在探討的問題。解決這一問題的一種方法是利用神經(jīng)網(wǎng)絡(luò)復(fù)制人類的行為。這就是所謂的模仿學(xué)習(xí)(也稱為學(xué)徒學(xué)習(xí),或從示范學(xué)習(xí))。
訓(xùn)練過程類似于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)如何通過繪制過去和未來之間的關(guān)聯(lián)來預(yù)測其他交通參與者的行為。在模仿學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)通過繪制它所看到的(通過計算機視覺神經(jīng)網(wǎng)絡(luò))和人類駕駛員所采取的動作之間的關(guān)聯(lián)來預(yù)測人類駕駛員會做什么。
最近,在模仿學(xué)習(xí)領(lǐng)域炙手可熱的明星,不得不提及DeepMind出品的AlphaStar。DeepMind使用了數(shù)百萬人類參與的《星際爭霸》游戲數(shù)據(jù)庫中的例子,來訓(xùn)練神經(jīng)網(wǎng)絡(luò)像人類一樣打游戲。網(wǎng)絡(luò)學(xué)會了游戲狀態(tài)和人類玩家行為之間的關(guān)聯(lián),從而學(xué)會了預(yù)測人類在面對不同游戲狀態(tài)時采取的不同動作。僅通過這種訓(xùn)練,AlphaStar便達到了DeepMind估計的水平,使其大致處于《星際爭霸》競爭力排行榜的中間位置。后來,AlphaStar通過強化學(xué)習(xí)提升到職業(yè)水平的能力。
同理,特斯拉正在將模仿學(xué)習(xí)應(yīng)用到駕駛?cè)蝿?wù)中,比如,如何處理高速公路上常見的立體交叉路況,或者如何在十字路口左轉(zhuǎn)。據(jù)外媒報道稱,特斯拉會將模仿學(xué)習(xí)擴展到更多的任務(wù)中,比如如何以及何時在高速公路上換車道。特斯拉人工智能總監(jiān)安德烈·卡帕西(Andrej Karpathy)曾經(jīng)描述了特斯拉如何使用模仿學(xué)習(xí)。
與預(yù)測結(jié)果一樣,上傳汽車周圍場景的抽象表示,而不是上傳視頻,這表示,神經(jīng)網(wǎng)絡(luò)只需要更低的帶寬和內(nèi)存需求就足以供神經(jīng)網(wǎng)絡(luò)模仿學(xué)習(xí)。同樣,一旦數(shù)據(jù)上傳,就不需要人為標(biāo)記。由于神經(jīng)網(wǎng)絡(luò)預(yù)測人類駕駛員在給定環(huán)境狀態(tài)下會做什么,所以它只需要“給定的環(huán)境狀態(tài)”和“駕駛員動作”即可。模仿學(xué)習(xí)本質(zhì)上是預(yù)測特斯拉司機的行為,而不是預(yù)測特斯拉周圍其他交通參與者的行為。與AlphaStar一樣,所有需要的信息都包含在回放中。
根據(jù)卡帕西關(guān)于預(yù)測切入(predictingcut-ins)的評論,特斯拉在未能正確預(yù)測前方車輛是否會進入特斯拉車道時觸發(fā)保存回放。類似地,當(dāng)涉及路徑規(guī)劃或駕駛策略的神經(jīng)網(wǎng)絡(luò)無法正確預(yù)測特斯拉駕駛員的行為時,特斯拉可能會捕獲回放數(shù)據(jù)。埃隆·馬斯克(Elon Musk)過去曾提到過這種功能,不過這種功能的使用情況,尚未得到證實。
其他捕捉回放的情況包括:突然剎車或急轉(zhuǎn)彎、自動緊急剎車、碰撞或碰撞警告,以及更為復(fù)雜的機器學(xué)習(xí)技術(shù),即異常檢測和新奇檢測。如果特斯拉已經(jīng)知道它想要捕捉什么,比如十字路口的左轉(zhuǎn),它就可以設(shè)置一個觸發(fā)器,每當(dāng)視覺神經(jīng)網(wǎng)絡(luò)看到交通燈,左轉(zhuǎn)彎信號被激活,或者方向盤向左轉(zhuǎn)彎時,它就會捕捉回放。
結(jié)論
特斯拉擁有約50萬輛汽車,在以下三個關(guān)鍵領(lǐng)域相對于Waymo(和其他競爭對手)具有優(yōu)勢:
1.計算機視覺
2.預(yù)測
3.路徑規(guī)劃/駕駛策略
商業(yè)分析人士、記者和普通大眾的多數(shù)觀點似乎是,Waymo在自動駕駛方面遙遙領(lǐng)先,特斯拉則遠遠落后。當(dāng)你研究神經(jīng)網(wǎng)絡(luò)的基本原理時,就會發(fā)現(xiàn),上述觀點是沒有意義的。
更重要的是,AlphaStar證明了大規(guī)模模仿學(xué)習(xí)對于復(fù)雜任務(wù)的概念。有學(xué)者認(rèn)為,如果對特斯拉采用方法的正確性存疑,或者認(rèn)為路徑規(guī)劃/駕駛策略是一個簡單問題的話,那么可以思考一下,為什么模仿學(xué)習(xí)在《星際爭霸》中行得通,在自動駕駛中卻行不通。
基于以上分析,有學(xué)者旗幟鮮明地表示:除非Waymo在未來1-3年內(nèi)擴大其車隊規(guī)模,否則,“Waymo遙遙領(lǐng)先、特斯拉遠遠落后的觀點”將被證實是錯誤的。人們把太多的注意力放在演示上,可惜這些演示沒有表明系統(tǒng)的魯棒性。人們對訓(xùn)練數(shù)據(jù)的關(guān)注太少,尤其對那些Waymo沒有足夠的數(shù)據(jù)來做好基于機器學(xué)習(xí)的罕見的物體和行為關(guān)注更少。
仿真并不是Waymo的優(yōu)勢,因為包含特斯拉在內(nèi)的所有的自動駕駛汽車公司都在使用仿真。更為重要的是,仿真無法預(yù)測或不知道如何準(zhǔn)確地對罕見對象和罕見行為建模。
還有一項對科技工作者的調(diào)查表明,特斯拉是舊金山灣區(qū)第二大最受歡迎的公司,僅次于谷歌。調(diào)查還發(fā)現(xiàn),特斯拉在全球最受歡迎的公司中排名第四,比排名第二的谷歌落后兩名。(Shopify在全球排名第三,SpaceX排名第一。)同樣值得注意的是,機器學(xué)習(xí)領(lǐng)域的最新科研成果活方法經(jīng)常被學(xué)術(shù)界、OpenAI以及谷歌、Facebook和DeepMind的企業(yè)實驗室公開分享。特斯拉能做什么和Waymo能做什么之間的區(qū)別可能不是那么大。
這兩家公司最大的不同在于數(shù)據(jù)。隨著特斯拉汽車數(shù)量增長到100萬輛,其月行駛里程將達到約10億英里,是Waymo約100萬英里的1000倍。對于特斯拉來說,1000倍的差異意味著優(yōu)越的稀有物體檢測,優(yōu)越的稀有行為預(yù)測,以及優(yōu)越的路徑規(guī)劃/駕駛策略。自動駕駛的挑戰(zhàn)更多的是處理可能只有0.01%的罕見的邊緣情況,而不是99.99%的通用場景。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
推薦專題
- IE工程師(汽車智聯(lián)) 惠州碩貝德無線科技股份有限公司
- 現(xiàn)場技術(shù)支持工程師(汽車) 易思維(杭州)科技股份有限公司
- 銷售經(jīng)理(汽車新能源行業(yè)) 廣州瑞松智能科技股份有限公司
- 結(jié)構(gòu)工程師-汽車電子事業(yè)部(J10116) 深圳奧尼電子股份有限公司
- 銷售總監(jiān)-汽車電子方向 深圳市智立方自動化設(shè)備股份有限公司
- 項目經(jīng)理(汽車內(nèi)飾&汽車電子) 伯恩光學(xué)(惠州)有限公司
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市