毫末AI DAY的智駕彈藥:上有「世界模型」,下有3000元方案
作者|張祥威
編輯|德新
「我們的感知能力可以說(shuō)能做到識(shí)別萬(wàn)物了!购聊┲切性诘诰艑煤聊〢I DAY上拋出這一豪言。?
識(shí)別萬(wàn)物的底氣,源于毫末的DriveGPT自動(dòng)駕駛大模型引入了通用語(yǔ)義大模型,可以對(duì)交通參與者者、道路環(huán)境等做到全面感知。?
今年是智駕獲得公眾接受度的關(guān)鍵節(jié)點(diǎn)。?
而明年,隨著技術(shù)門(mén)檻更高的「無(wú)圖」城市NOA落地,頭部智駕頭部玩家大概率會(huì)迎來(lái)收獲期。毫末在自動(dòng)駕駛大模型上的諸多準(zhǔn)備,正是為迎接大戰(zhàn)。?
不止有進(jìn)化的大模型,毫末還帶來(lái)三款高級(jí)輔助駕駛產(chǎn)品HP170、HP370、HP570,劍指無(wú)圖城市NOH、記憶行車(chē)等大熱功能。?
當(dāng)下,毫末智駕方案已經(jīng)在山海炮HEV版、新摩卡Hi-4S等車(chē)型上搭載,明年一季度,搭載毫末城市NOH功能的魏牌藍(lán)山將量產(chǎn)交付。?
智駕大規(guī)模普及的時(shí)刻就要到來(lái),毫末開(kāi)始加快腳步。?
與眾多公司的科技日如特斯拉AI ?DAY、蔚來(lái)NIO DAY相比,這屆毫末AI DAY的既有前沿技術(shù)進(jìn)展的分享,又有極具競(jìng)爭(zhēng)力的落地方案,有諸多看點(diǎn)。?
一、克制的智駕方案
AI DAY上,毫末一口氣推出三款智駕方案產(chǎn)品,共同點(diǎn)是「極致性價(jià)比」。?
·HP170:算力5 TOPS,傳感器方案標(biāo)配1個(gè)前視相機(jī)、4個(gè)魚(yú)眼相機(jī)、2個(gè)后角雷達(dá)、12個(gè)超聲波雷達(dá),支持選裝1個(gè)前視雷達(dá)和2個(gè)前角雷達(dá)。
·HP370:算力32 TOPS,傳感器方案標(biāo)配2個(gè)前視相機(jī)、2個(gè)側(cè)視相機(jī)、1個(gè)后視相機(jī)、4魚(yú)眼相機(jī)、1個(gè)前雷達(dá)、2個(gè)后角雷達(dá)、12個(gè)超聲波雷達(dá),支持選裝2個(gè)前角雷達(dá)。
·HP570:算力可選72 TOPS和100 TOPS兩款芯片,傳感器方案標(biāo)配2個(gè)前視相機(jī)、4個(gè)側(cè)視相機(jī)、1個(gè)后視相機(jī)、4個(gè)魚(yú)眼相機(jī)、1個(gè)前雷達(dá)、12個(gè)超聲波雷達(dá),支持選配1顆激光雷達(dá)。
對(duì)比同行,這幾套方案有以下特點(diǎn):?
首先,更低的芯片算力。?
毫末采用基于5TOPS的芯片算力平臺(tái)實(shí)現(xiàn)高速NOA,而實(shí)現(xiàn)城市NOA的方案,最高只需要要100TOPS的算力,比主流城市NOA智駕方案所需的算力都要低。?
據(jù)HiEV了解,三套方案中的芯片分別為地平線征程3、TI的TDA4,以及高通Ride的SA8650芯片,這種高中低采用不同芯片方案的策略,也為量產(chǎn)搭載更多款車(chē)型提供了條件。?
主流的智駕方案中,實(shí)現(xiàn)城市NOA通常需要兩顆英偉達(dá)Oin X芯片,算力為508TOPS,少數(shù)玩家如智己、騰勢(shì),可以基于單顆英偉達(dá)Orin X芯片,算力為254TOPS。當(dāng)然,更低算力的要屬特斯拉的FSD,僅需144TOPS。?
更低算力,意味著需要對(duì)算力有更極致地有效利用,同時(shí)要強(qiáng)化算法的能力。用更低的算力實(shí)現(xiàn)城市NOA,毫末的智駕技術(shù)水準(zhǔn)和市場(chǎng)野心可見(jiàn)一斑。?
其次,在傳感器規(guī)模上也相對(duì)克制。?
相較行業(yè)主流方案,毫末的智駕方案數(shù)量會(huì)更少一些。以搭載高階智駕全享包的騰勢(shì)N7作對(duì)比,這款車(chē)搭載33個(gè)傳感器:?
2個(gè)激光雷達(dá)、5個(gè)毫米波雷達(dá)、2個(gè)前視攝像頭、4個(gè)環(huán)視攝像頭、12個(gè)超聲波雷達(dá)、4個(gè)側(cè)視攝像頭、1個(gè)后視攝像頭、1個(gè)OMS攝像頭、1個(gè)DMS攝像頭、1個(gè)DVR攝像頭。?
毫末可以實(shí)現(xiàn)高階智駕同等功能的HP570,傳感器數(shù)量為24個(gè),其縮減的部分是,方案中減少了毫米波雷達(dá),而且激光雷達(dá)也并非標(biāo)配。?
最后,由于更低的算力的芯片,以及克制的傳感器規(guī)模,還帶來(lái)第三個(gè)特點(diǎn),更低的BOM成本。?
毫末智行董事長(zhǎng)張凱認(rèn)為,「讓中階智駕便宜好用,讓高階智駕好用更便宜,是毫末未來(lái)一年提交給中國(guó)智駕市場(chǎng)的答卷!?
毫末的三款智駕產(chǎn)品,最低為3000元級(jí)別,最高的高階自動(dòng)駕駛方案大概8000元級(jí)別,這與現(xiàn)在動(dòng)輒上萬(wàn)的智駕選裝包相比,無(wú)疑頗具殺傷力。?
HiEV了解到,毫末的最新方案中,HP170已經(jīng)定點(diǎn),配合整車(chē)開(kāi)發(fā)和上市的節(jié)奏,預(yù)計(jì)會(huì)在明年初上市;HP550預(yù)計(jì)在明年上半年藍(lán)山的下一代車(chē)型搭載上市,支持記憶行車(chē)和記憶泊車(chē);HP370 預(yù)計(jì)明年量產(chǎn),而更新一代的HP570則會(huì)稍晚一些。?
長(zhǎng)線看,毫末的產(chǎn)品會(huì)全面平臺(tái)化,提供高中低全系的智駕方案。?
祭出成本更低的殺招,那么毫末的產(chǎn)品技術(shù)實(shí)力究竟如何呢??
二、可實(shí)現(xiàn)無(wú)圖城市NOH,2024落地百城
一家公司的智駕能力,既體現(xiàn)在產(chǎn)品的上車(chē)規(guī)模和行駛里程,也體現(xiàn)在技術(shù)能夠達(dá)到的廣度和上限。?
毫末的智駕方案HPilot產(chǎn)品已經(jīng)搭載超過(guò)20款車(chē)型,用戶輔助駕駛行駛里程突破8700萬(wàn)公里。由于起步不如蔚小理早,用戶輔助駕駛行駛里程規(guī)模還不像對(duì)方那么龐大,但從搭載車(chē)型上,搭載車(chē)型規(guī)模是遠(yuǎn)超蔚小理的。?
毫末的技術(shù)能力能力廣度和上限,體現(xiàn)在可實(shí)現(xiàn)的功能上。?
顧維灝說(shuō),毫末可以做到在城市道路中時(shí)速最高70公里在50米的距離下,就能檢測(cè)到大概35cm高的小目標(biāo)障礙物,可以做到100%的成功繞障或剎停。
下面一段視頻,可見(jiàn)毫末智駕方案的技術(shù)能力。???
面向L4的小魔駝,在城市開(kāi)放道路進(jìn)行無(wú)人駕駛時(shí),也已經(jīng)快于普通人騎自行車(chē)的速度。在行駛安全和通行效率上,均已達(dá)到商用狀態(tài)。?
與那些從基于高精地圖轉(zhuǎn)為去高精地圖方案的玩家相比,毫末一早確立了重感知輕地圖的技術(shù)路線。?
基于高精地圖的技術(shù)路線,開(kāi)頭容易,之后要在不同城市落地時(shí),會(huì)面臨泛化挑戰(zhàn)。而重感知輕地圖的好處是,開(kāi)始難,但越走越快,能完成更快的城市落地。?
毫末的高速無(wú)圖NOH功能,可以實(shí)現(xiàn)高速、城市快速路上的無(wú)圖NOH,短距離記憶泊車(chē)等功能,并獲E-NCAP 5星AEB的高安全標(biāo)準(zhǔn)認(rèn)證。?
此外,毫末還可實(shí)現(xiàn)高速、城快,以及城市內(nèi)的記憶行車(chē),免教學(xué)記憶泊車(chē)、智能繞障等功能。高階方案還支持無(wú)圖記憶行車(chē)和泊車(chē)。 ? ? ? ? ? ??
城市全場(chǎng)景無(wú)圖NOH,則可實(shí)現(xiàn)全場(chǎng)景城市無(wú)圖NOH、全場(chǎng)景輔助泊車(chē)、全場(chǎng)景智能繞障、跨層免教學(xué)記憶泊車(chē)等功能。?
早期行業(yè)主打的智駕功能是高速NOA,之后是城市NOA,并在研發(fā)城市NOA時(shí)同步去掉高精地圖,逐漸邁向今天的 去高精地圖的“無(wú)圖“階段。?
眼下能做到無(wú)圖的,僅有小鵬、華為、蔚來(lái)等少數(shù)幾家。誰(shuí)具備無(wú)圖能力,基本上便是智駕第一梯隊(duì)成員。?
毫末三款智駕產(chǎn)品的推出,意味著其智駕方案出手即高點(diǎn),廣度覆蓋了當(dāng)下熱門(mén)功能,上限與頭部玩持平,讓自身站位來(lái)到第一梯隊(duì)。按照計(jì)劃,毫末的城市NOH落地目標(biāo)是100城。·?
以上這些是毫末在乘用車(chē)NOH上的布局,會(huì)為明年智駕的普及大年做好準(zhǔn)備。而之所以能在成立后短短幾年做到無(wú)圖等水平,離不開(kāi)其核心,也是近幾屆AI DAY上常提到的自動(dòng)駕駛大模型。?
三、DriveGPT進(jìn)化,可識(shí)別萬(wàn)物
自動(dòng)駕駛其實(shí)是讓汽車(chē)學(xué)習(xí)人類駕駛,這需要感知道路上的各類交通參與者,處理真實(shí)世界中無(wú)窮無(wú)盡的突發(fā)狀況,最終順利抵達(dá)目的地。?
行業(yè)慣常做法,是在云端建立一個(gè)自動(dòng)駕駛生成式大模型,然后通過(guò)剪枝、蒸餾的方式,把云端大模型的能力下放到車(chē)端,從而讓汽車(chē)像人類司機(jī)一樣開(kāi)車(chē)。?
與人類大腦一樣,自動(dòng)駕駛生成式大模型也要不斷進(jìn)化。?
今年的CVPR 2023,特斯拉和英國(guó)自動(dòng)駕駛公司W(wǎng)ayve等均展示了自動(dòng)駕駛大模型的新進(jìn)展。?
目前,特斯拉可以利用大模型生成連續(xù)視頻,打造World Model即世界模型。?
Wayve也在朝類似方向努力,其自動(dòng)駕駛大模型GAIA-1,在通過(guò)持續(xù)擴(kuò)展后已經(jīng)擁有90億個(gè)參數(shù),可以生成駕駛場(chǎng)景視頻,描述場(chǎng)景以及做出預(yù)測(cè)。?
上月,Wayve還推出了視覺(jué)語(yǔ)言動(dòng)作模型LINGO-1,可用于描述自動(dòng)駕駛的行為和推理。?
這些做法,直白地講就是從原來(lái)僅學(xué)習(xí)文本,開(kāi)始向看圖、視頻學(xué)習(xí),從而與自動(dòng)駕駛不斷地更好融合。?
根據(jù)毫末官方數(shù)據(jù),目前團(tuán)隊(duì)已篩選出超過(guò)100億幀互聯(lián)網(wǎng)圖片數(shù)據(jù)集,480萬(wàn)包含人駕行為的自動(dòng)駕駛4D Clips。?
毫末將自動(dòng)駕駛分為三個(gè)時(shí)代,其中,自動(dòng)駕駛3.0時(shí)代需要1億公里。目前,用戶輔助駕駛行駛里程已經(jīng)達(dá)到8700多萬(wàn)公里,預(yù)計(jì)到年底可達(dá)到這一目標(biāo)。?
隨著數(shù)據(jù)規(guī)模的增加,也為了更好地進(jìn)入3.0時(shí)代,自動(dòng)駕駛大模型需要不斷進(jìn)化。?
感知模型中引入圖文多模態(tài)大模型,以完成4D向量空間到語(yǔ)義空間的對(duì)齊,做到可以具備「萬(wàn)物識(shí)別」的能力,毫末將其稱之為自動(dòng)駕駛語(yǔ)義感知大模型。?
基于自動(dòng)駕駛語(yǔ)義感知大模型,毫末還會(huì)通過(guò)構(gòu)建駕駛語(yǔ)言來(lái)描述駕駛環(huán)境和駕駛意圖,再結(jié)合導(dǎo)航引導(dǎo)信息和自車(chē)歷史動(dòng)作,借助LLM大語(yǔ)言模型做出駕駛決策。?
方向上,毫末正在沿著與特斯拉、Wayve同樣的方向,讓自動(dòng)駕駛大模型擁有更多的學(xué)習(xí)進(jìn)化途徑,這相當(dāng)于在建立自己的世界模型。?
這一過(guò)程中,大模型的進(jìn)化發(fā)生在多個(gè)方面:?
早期,Transformer是用于自然語(yǔ)言處理(NLP)的大模型,主要應(yīng)用于文本。之后Vision Transformer 又稱ViT出現(xiàn),主要用于圖像。?
直到后來(lái),又出現(xiàn)Swin transformer,一種由微軟提出的視覺(jué)領(lǐng)域的Transformer大模型。?
在ViT圖像大模型的基礎(chǔ)上,Swin transformer進(jìn)一步對(duì)圖片進(jìn)行圖像分割,可以用于處理多視覺(jué)任務(wù),更好地完成CV領(lǐng)域的目標(biāo)檢測(cè)和語(yǔ)義分割任務(wù)。?
過(guò)去兩年,毫末的視覺(jué)大模型的進(jìn)化,與行業(yè)趨勢(shì)一致,其CV Backbone先是從CNN模型全面切換到ViT,并又在今年全面升級(jí)到Swin transformer。?
訓(xùn)練大模型方面,行業(yè)早期主要基于人工標(biāo)注的單幀圖片有監(jiān)督,后來(lái)結(jié)合4D自動(dòng)標(biāo)注,再進(jìn)一步升級(jí)到基于自動(dòng)標(biāo)注的4D Clip的有監(jiān)督訓(xùn)練,到今天基于大規(guī)模數(shù)據(jù)的自監(jiān)督學(xué)習(xí)訓(xùn)練,從而可以輕松吃下上百億幀圖片。?
在毫末最新的模型中,已經(jīng)可以采用視頻生成的方式,通過(guò)預(yù)測(cè)生成視頻下一幀的方式來(lái)構(gòu)建4D表征空間,使CV Backbone學(xué)到三維的幾何結(jié)構(gòu)、圖片紋理、時(shí)序信息等全面的物理世界信息。?
以上這些動(dòng)作,主要解決了大模型領(lǐng)域的數(shù)據(jù)采集和標(biāo)注效率低、泛化能力差等問(wèn)題,解決的其他問(wèn)題還包括:?
·怎么做到高效、低成本地從上百億的數(shù)據(jù)中,篩選出幾萬(wàn)個(gè)有效數(shù)據(jù);
·怎么做到從閉集到開(kāi)集,可以標(biāo)注任意物體;
·如何高效的場(chǎng)景遷移;
·怎樣讓駕駛行為具備可解釋性等等。
毫末將自動(dòng)駕駛分為三個(gè)時(shí)代,其中,自動(dòng)駕駛3.0時(shí)代需要1億公里。目前,用戶輔助駕駛行駛里程已經(jīng)達(dá)到8700多萬(wàn)公里,預(yù)計(jì)到年底可達(dá)到這一目標(biāo)。?
總體上,這屆AI DAY為毫末邁過(guò)自動(dòng)駕駛3.0時(shí)代提供了更多彈藥支持,從云端到車(chē)端做了充分準(zhǔn)備。上有愈發(fā)聰明的自動(dòng)駕駛大模型,下有性價(jià)比十足的智駕方案,毫末已經(jīng)做好了明年智駕的卡位。?
原文標(biāo)題 : 毫末AI DAY的智駕彈藥:上有「世界模型」,下有3000元方案
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
驗(yàn)證碼: 刷新
圖片新聞
最新活動(dòng)更多
-
11月19日立即報(bào)名>> 【線下論壇】華邦電子與恩智浦聯(lián)合技術(shù)論壇
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 蔡司新能源汽車(chē)三電質(zhì)量解決方案
-
精彩回顧立即查看>> 蔡司新能源汽車(chē)三電質(zhì)量解決方案
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會(huì)暨展覽會(huì)
-
精彩回顧立即查看>> 【線下會(huì)議】全數(shù)會(huì)2024電子元器件展覽會(huì)
- 1 “作弊器”不靈了?智駕的激光雷達(dá),正在被攝像頭替代
- 2 被逼墻角的Mobileye,祭出 CAIS 大旗,挑戰(zhàn)端到端大模型智能駕駛
- 3 4 激光雷達(dá)與純視覺(jué)方案,哪個(gè)才是自動(dòng)駕駛最優(yōu)選?
- 5 激光雷達(dá)即將降價(jià),純視覺(jué)回到鄙視鏈底層?
- 6 如何跑贏汽車(chē)智能化下半場(chǎng)?
- 7 從小鵬、理想、蔚來(lái)布局看自動(dòng)駕駛發(fā)展趨勢(shì)
- 8 智能駕駛的百生相,你是該信呢?還是該信呢?
- 9 比亞迪技術(shù)魚(yú)池大戰(zhàn)豐田工具箱,誰(shuí)將主導(dǎo)未來(lái)汽車(chē)市場(chǎng)?
- 10 全網(wǎng)最詳解! 美國(guó)禁止中國(guó)智駕究竟包括哪些?
- IE工程師(汽車(chē)智聯(lián)) 惠州碩貝德無(wú)線科技股份有限公司
- 現(xiàn)場(chǎng)技術(shù)支持工程師(汽車(chē)) 易思維(杭州)科技股份有限公司
- 銷(xiāo)售經(jīng)理(汽車(chē)新能源行業(yè)) 廣州瑞松智能科技股份有限公司
- 結(jié)構(gòu)工程師-汽車(chē)電子事業(yè)部(J10116) 深圳奧尼電子股份有限公司
- 銷(xiāo)售總監(jiān)-汽車(chē)電子方向 深圳市智立方自動(dòng)化設(shè)備股份有限公司
- 項(xiàng)目經(jīng)理(汽車(chē)內(nèi)飾&汽車(chē)電子) 伯恩光學(xué)(惠州)有限公司
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市