侵權投訴
訂閱
糾錯
加入自媒體

智能汽車 AI 101,以及“端到端”和“復合方法”之間有什么區(qū)別?

2024-08-26 11:14
vehicle公眾號
關注

電氣化之后智能化,汽車的智能化怎么也脫不開人工智能AI,無 AI 不智能這是大家所有人的共識了。但,到底AI是什么?它在汽車行業(yè)應用的發(fā)展是怎么樣的?大家競相宣傳和討論的端到端到底什么?它和之前其他AI算法有什么區(qū)別?此類問題卻常讓大家競相莫名圍觀吃瓜。

所以,本文將結合AI在汽車行業(yè)的應用和發(fā)展,總結下人工智能機器學習

深度學習

端到端等 AI 人工智能 101概念內容,幫助大家了解AI,以及它在智能汽車中的應用和發(fā)展,也方便理解前熱門的各類概念和事件。

人工智能(Artificial Intelligence, AI)人工智能是一門在計算機中模擬智能行為的科學。它使計算機能夠展現出類似人類的行為特征,包括知識、推理、常識、學習和決策能力。

他們的核心就是多層的神經網絡(Neural Networks),神經網絡是一種計算機架構,它模擬了人腦的結構,AI/機器學習程序可以在此基礎上構建。

神經網絡由相互連接的節(jié)點組成,這些節(jié)點可以解決更復雜的問題并進行學習,類似于人腦中的神經元,每個節(jié)點用權重,偏差等參數去計算傳導到下一步,產生結果。所以,參數等成了當前模型的一個重要參考指標,理論上參數越多代表模型學習更完善,產生結果更真實,在今年英偉達的 GTC 上,Jensen 透露了一條關于當今最大模型的看似有趣的消息,稱“當今最大的模型是 1.8T 參數“。機器學習(Machine Learning)機器學習是人工智能的一個分支,它使計算機能夠在沒有明確編程的情況下從數據中學習。例如,計算機可以通過數據學習識別狗或貓等對象。所以智能駕駛最開始的Mobileye就是采用視覺機器學習,讓車輛識別前方車輛,行人自行車等VRU,前方道路線,交通標志等,這樣實現了AEB,LCC車道保持等功能。

傳統(tǒng)的機器學習方法需要大量的人力來訓練軟件。例如,在自動駕駛施工道路的障礙物識別中,需要做以下操作:手動標記數十萬張施工道路以及相關標志的圖像。讓機器學習算法處理這些圖像。用一組未知或者叫泛化的圖像上測試這些算法。找出某些結果不準確的原因。通過標注新圖像來改進數據集,以提高結果準確性。這個過程稱為有監(jiān)督學習。在有監(jiān)督學習中,只有廣泛且充分多樣化的數據是準確率的前提。例如,該算法可能可以準確識別放置非常正面的施工道路牌,但不能準確識別斜向放置的施工道路牌,因為訓練數據集包含更多正面施工道路圖像。在這種情況下,那么就需要標記更多的斜向放置的施工道路牌圖像并再次訓練機器學習模型。國內汽車智能駕駛大概在2019年左右,都在通過大量的人工數據采集和標注的方式,瘋狂通過這種方式訓練學習模型,最后在2019年特斯拉推出其算法之后,所有訓練數據和算法推倒重來。

深度學習(Deep Learning):深度學習是機器學習的一個子集,深度學習擁有更多的分層的層級結構。例如,在識別施工道路牌的例子中,不同的層可能對應于給定施工道路牌的關鍵特征。所以,深度學習能夠高效處理非結構化數據,發(fā)現數據之間隱藏的關系和模式,它能夠做到無監(jiān)督學習Unsupervised learning,強化學習Reinforcement learning (RL)。例如施工道路牌,它能夠識別逆光,殘缺甚至倒地的施工道路牌。強化學習(RL),可以訓練軟件做出決策,以實現最佳結果。它模仿了人類為實現目標所采取的反復試驗的學習過程。有助于實現目標的軟件操作會得到加強,而偏離目標的操作將被忽略。ChatGPT剛推出那會兒,Open AI就對使用RL做了簡單介紹,RL 算法在處理數據時使用獎懲模式。這些算法從每個操作的反饋中學習,并自行發(fā)現實現最終結果的最佳處理路徑。此類算法還能夠實現延遲滿足。最好的整體策略可能需要短期的犧牲,因此其發(fā)現的最佳方法可能包括一些懲罰,或在過程中有一些迂回。RL 是一種強大的方法,可以幫助人工智能(AI)系統(tǒng)在看不見的環(huán)境中實現最佳結果。當人工智能算法可以無監(jiān)督和自我強化學習,對于人工智能最重要的事情就剩下:

大量高質量的數據,在大量高質量數據上訓練深度學習算法時,可以獲得更好的效果。輸入數據集中的異常值或錯誤會顯著影響深度學習過程。例如,在我們的動物圖像示例中,如果數據集中意外引入了非動物圖像,深度學習模型可能會將飛機歸類為海龜。為避免此類錯誤,必須先清理和處理大量數據,然后再訓練深度學習模型。輸入數據預處理需要大量的數據存儲容量。

強大的算力芯片中心,深度學習算法是計算密集型的,需要具有足夠計算能力的基礎設施才能正常運行。否則,它們需要很長的時間來處理結果。

能源,數據存儲處理以及計算消耗的能源成為繼物理做功之后又一重要消耗,這也是為什么最近Open AI Sam奧特曼多次不同場合表示對核電感興趣。

在此類人工智能算法的背景下,理想條件下,只需要喂養(yǎng)高質量數據,在強大算力,和豐富能源供給的條件下 AI 可以給人類帶來無窮的應用。端到端方法( End-to-End Approach)在2023年,特斯拉開始宣布端到端的智能駕駛算法,他所謂的端到端方法是一個單一模型,它直接從視覺輸入到輸出駕駛策略,如轉向和制動。這種方法減少了人工編碼的需求,并可能有助于解決迄今為止限制自動駕駛進展的邊緣情況。

熟悉智能駕駛應該大概都了解,智能駕駛幾要素,感知,定位,規(guī)劃,控制等流程。目前智能駕駛算法組合大概有三種方式:

感知采用AI神經網絡+規(guī)則控制

各個區(qū)塊都采用神經網絡

端到端融合神經網絡

特斯拉算是從第一個走到了第三步。

其實目前大都在第一步和第二步此類的復合解決方案,它可以使用AI處理不同的子系統(tǒng)或輸入。然后,這個解決方案可以與組合不同的代碼一起使用,或者覆蓋其他規(guī)則/因素(例如,確保遵守某些交通法規(guī))。盡管有爭議,這種復合方法是否會限制AI在難以理解的長尾邊緣情況場景中所能達到的程度,但它:很有效率(例如,ChatGPT不需要使用AI訓練來解決基本數學問題,它可以直接查詢計算器模塊),可能更容易理解/驗證(這在駕駛中尤其重要,因為AI的錯誤可能是致命的)。仍然使用高級AI技術,如Transformer,Occupancy等等。這些概念為理解AI在自動駕駛汽車中的應用提供了基礎,并解釋了不同AI方法如何影響技術的開發(fā)和實施,目前很難說誰好誰不好。其他汽車人工智能應用其實,語音算是在智能汽車上應用最廣和最快的,畢竟人工智能發(fā)展最快的就是語音和文本模型,例如ChatGPT 此類LLM大語言模型激發(fā)了智能駕駛端到端,基本 AI 原理雷同,目前沒有說主機廠自研語音算法的,主要是這個產業(yè)已經發(fā)展完備,集中頭部供應商提供解決方案。當然,智能駕駛也應該快速走向這個過程,頭部供應商提供解決方案,畢竟最終路徑和技術趨同統(tǒng)一,大家都沒有必要重復造輪子了。

*未經準許嚴禁轉載和摘錄-參考資料:

Can new AI technology help accelerate AV deployment?- 高盛

       原文標題 : 智能汽車 AI 101,以及“端到端”和“復合方法”之間有什么區(qū)別?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號