2023年以來(lái),越來(lái)越多車型開始接入大模型,越來(lái)越多Tier1推出汽車大模型解決方案。特斯拉FSD V12的出色進(jìn)展和SORA的推出,更加速了AI大模型在座艙和智駕領(lǐng)域的落地。
端到端自動(dòng)駕駛大模型的發(fā)展突飛猛進(jìn)
2023年2月,采用端到端自動(dòng)駕駛模型的特斯拉FSD v12.2.1已經(jīng)開始陸續(xù)在美開啟推送,不僅僅是員工和測(cè)試人員。根據(jù)首批客戶的反饋,F(xiàn)SD V12 相當(dāng)強(qiáng)大,讓以前不相信不敢用自動(dòng)駕駛的普通人也敢于使用FSD了。譬如,特斯拉 FSD V12 可繞行路邊積水,一位特斯拉的工程師評(píng)論說(shuō):這種開法很難用明確的代碼來(lái)實(shí)現(xiàn),但特斯拉的端到端方案幾乎毫不費(fèi)力地實(shí)現(xiàn)了。
自動(dòng)駕駛AI大模型的發(fā)展可以分為四個(gè)階段:
1.0時(shí)代就是在感知層面使用大模型(Transformer);
2.0時(shí)代就是模塊化,感知規(guī)控決策都用大模型;
3.0時(shí)代就是端到端大模型(一“端”是傳感器的原始數(shù)據(jù),另一“端”直接輸出駕駛動(dòng)作);
4.0時(shí)代就是從垂直領(lǐng)域的人工智能走向通用領(lǐng)域的人工智能(AGI的世界模型)。
現(xiàn)在多數(shù)公司處于2.0時(shí)代。特斯拉FSD V12已處于3.0時(shí)代。其他主機(jī)廠和Tier1紛紛跟進(jìn)FSD V12的端到端大模型。2024年1 月 30 日,小鵬汽車宣布,小鵬的端到端模型下一步將會(huì)全面上車。據(jù)悉,蔚來(lái)和理想的“基于端到端”自動(dòng)駕駛模型也將在2024年上線。
FSD V12駕駛決策交由AI算法生成,用海量視頻數(shù)據(jù)訓(xùn)練出的端到端神經(jīng)網(wǎng)絡(luò),替換掉了超過(guò)30萬(wàn)行C++代碼。FSD V12提供了一條有待驗(yàn)證的全新路徑,若得以走通,將對(duì)行業(yè)產(chǎn)生顛覆性影響。
2月16日,OpenAI發(fā)布文本生成視頻模型SORA,標(biāo)志著AI視頻應(yīng)用即將大規(guī)模應(yīng)用的前夜。SORA不僅支持通過(guò)文本或圖像生成長(zhǎng)達(dá)60秒的視頻,其視頻生成能力、復(fù)雜場(chǎng)景和角色生成能力、以及對(duì)物理世界模擬的能力,都顯著超越了之前的技術(shù)。
SORA和FSD V12都是通過(guò)視覺讓AI能夠理解甚至模擬真實(shí)的物理世界。Elon Mask認(rèn)為,“FSD 12和Sora不過(guò)是AI通過(guò)視覺認(rèn)知世界、理解世界上的兩個(gè)開花結(jié)果,F(xiàn)SD最終用于駕駛行為,Sora則是用來(lái)生成視頻?!?
SORA的爆火,進(jìn)一步證明了FSD V12的合理性。馬斯克稱「特斯拉已經(jīng)能夠制作真實(shí)世界視頻大約一年了」。
來(lái)源:Twitter
AI大模型快速演化,帶來(lái)全新機(jī)會(huì)
最近三年,自動(dòng)駕駛大模型經(jīng)歷了若干次的演化,領(lǐng)先車企的自動(dòng)駕駛系統(tǒng)幾乎每年要重寫一次。這也給后來(lái)者提供了切入機(jī)會(huì)。
CVPR2023上,商湯、OpenDriveLab、地平線等聯(lián)合發(fā)布的端到端的自動(dòng)駕駛算法UniAD,獲得了2023年的最佳論文。
2024年初,中科慧拓技術(shù)團(tuán)隊(duì)和中科院自動(dòng)化所共同提出的生成式端到端自動(dòng)駕駛模型GenAD,將生成式人工智能(Generative AI)和端到端自動(dòng)駕駛技術(shù)結(jié)合,是業(yè)界首個(gè)生成式端到端自動(dòng)駕駛模型。該技術(shù)顛覆了UniAD的漸進(jìn)式流程端到端方案,探討了一種新的端到端自動(dòng)駕駛范式,關(guān)鍵在于采用生成式人工智能的方式預(yù)測(cè)自車和周圍環(huán)境在過(guò)去場(chǎng)景中的時(shí)序演變方式。
來(lái)源:中科慧拓
2024年2月,地平線和華中科技大學(xué)提出了VADv2,一個(gè)基于概率規(guī)劃的端到端駕駛模型。VADv2以流方式輸入多視角圖像序列,將傳感器數(shù)據(jù)轉(zhuǎn)換為環(huán)境標(biāo)記嵌入,輸出動(dòng)作的概率分布,并從中采樣一個(gè)動(dòng)作來(lái)控制車輛。僅使用攝像頭傳感器,VADv2在CARLA Town05基準(zhǔn)測(cè)試中實(shí)現(xiàn)了最先進(jìn)的閉環(huán)性能,顯著優(yōu)于所有現(xiàn)有方法。它能夠在完全端到端的方式下穩(wěn)定運(yùn)行,甚至不需要基于規(guī)則的封裝。
來(lái)源:地平線
在Town05長(zhǎng)距離基準(zhǔn)測(cè)試中,VADv2取得了85.1的駕駛分?jǐn)?shù),98.4的路程完成度,以及0.87的違規(guī)分?jǐn)?shù),如表1所示。與之前的最先進(jìn)方法相比,VADv2在路程完成度更高的同時(shí),顯著提高了駕駛分?jǐn)?shù),增加了9.0。值得注意的是,VADv2僅使用攝像頭作為感知輸入,而DriveMLM同時(shí)使用了攝像頭和激光雷達(dá)。此外,與之前僅依賴攝像頭最佳方法相比,VADv2顯示出更大的優(yōu)勢(shì),駕駛分?jǐn)?shù)的顯著提高達(dá)到了16.8。
來(lái)源:地平線
也是在2024年2月,清華大學(xué)交叉信息研究院和理想汽車提出了 DriveVLM。DriveVLM的整體流程如下圖所示。一系列圖像被大型視覺語(yǔ)言模型(VLM)處理,以執(zhí)行特定的鏈?zhǔn)剿季S(CoT)推理,得出駕駛規(guī)劃結(jié)果。這個(gè)大型VLM包括一個(gè)視覺編碼器和一個(gè)大型語(yǔ)言模型(LLM)。
來(lái)源:清華大學(xué)交叉信息研究院
由于VLMs在空間推理和高計(jì)算需求方面的局限性,DriveVLM團(tuán)隊(duì)又提出了DriveVLM-Dual,一個(gè)結(jié)合了DriveVLM與傳統(tǒng)自主駕駛流水線優(yōu)勢(shì)的混合系統(tǒng)。DriveVLM-Dual可選擇性地將DriveVLM與傳統(tǒng)的3D感知和規(guī)劃模塊相結(jié)合,例如3D目標(biāo)檢測(cè)器、占用網(wǎng)絡(luò)和運(yùn)動(dòng)規(guī)劃器,使系統(tǒng)能夠?qū)崿F(xiàn)3D定位和高頻規(guī)劃能力。這種雙重系統(tǒng)設(shè)計(jì),類似于人腦的慢速和快速思考過(guò)程,能夠有效適應(yīng)駕駛場(chǎng)景中不斷變化的復(fù)雜性。
大模型興起,AI和云計(jì)算公司受關(guān)注
AI大模型興起,算力、算法和數(shù)據(jù)三者缺一不可。擅長(zhǎng)算法,儲(chǔ)備了大量算力的AI公司(如科大訊飛、商湯科技、曠視科技等),以及具備強(qiáng)大智算中心的云計(jì)算公司(如浪潮、火山引擎、騰訊云等)受到主機(jī)廠關(guān)注。
商湯在AI大模型領(lǐng)域布局了座艙多模態(tài)大模型SenseChat-Vision、AIDC智算中心(6000P算力)、自動(dòng)駕駛大模型DriveMLM。2024年初,商湯推出DriveMLM,在閉環(huán)測(cè)試最權(quán)威榜單CARLA上取得很好的成績(jī)。DriveMLM是介于模塊化和端到端方案之間的中間方案,具備可解釋性。
來(lái)源:商湯科技
在自動(dòng)駕駛的Corner Case采集上,火山引擎和毫末智行一起將大模型應(yīng)用在場(chǎng)景生成和標(biāo)注提效上。在火山引擎提供的云服務(wù)能力支持下,毫末DriveGPT大模型的預(yù)標(biāo)注,整體效率提升了10倍。
2023年,騰訊發(fā)布了在智能汽車云、智駕云圖、智能座艙等領(lǐng)域的升級(jí)產(chǎn)品和方案。算力方面,騰訊智能汽車云帶來(lái)3.2Tbps帶寬,算力性能提升3倍,通信性能提升10倍,計(jì)算集群GPU利用率提升60%以上,為智能駕駛大模型訓(xùn)練提供高帶寬、低延遲的智算能力支撐。
在訓(xùn)練加速方面,騰訊智能汽車云結(jié)合太極Angel訓(xùn)練加速框架,訓(xùn)練速度相比業(yè)界主流框架提高1倍,推理速度相比業(yè)界主流框架提升1.3倍。博世、蔚來(lái)汽車、英偉達(dá)、奔馳、文遠(yuǎn)知行等企業(yè)目前都是騰訊智能汽車云的用戶。2024年,騰訊將進(jìn)一步加強(qiáng)AI大模型的建設(shè)。
審核編輯:劉清
-
特斯拉
+關(guān)注
關(guān)注
66文章
6378瀏覽量
129205 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
790文章
14326瀏覽量
170750 -
FSD
+關(guān)注
關(guān)注
0文章
105瀏覽量
6745 -
OpenAI
+關(guān)注
關(guān)注
9文章
1210瀏覽量
8952 -
大模型
+關(guān)注
關(guān)注
2文章
3148瀏覽量
4091
原文標(biāo)題:汽車AI大模型研究:端到端突飛猛進(jìn),大模型演化帶來(lái)全新機(jī)會(huì)
文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
2025年汽車微電機(jī)及運(yùn)動(dòng)機(jī)構(gòu)行業(yè)研究報(bào)告

2024-2025年新車及供應(yīng)商發(fā)展趨勢(shì)分析
2024年AI編程技術(shù)與工具發(fā)展總結(jié)

車載語(yǔ)音高階功能裝配率飆升,趨向認(rèn)知交互發(fā)展

2024年乘用車車機(jī)系統(tǒng)三大OTA亮點(diǎn)功能盤點(diǎn)

自動(dòng)駕駛域控研究:One board/One Chip方案將對(duì)汽車供應(yīng)鏈產(chǎn)生深遠(yuǎn)影響

佐思數(shù)據(jù):2023-2024年1-10月中國(guó)乘用車新車毫米波雷達(dá)安裝量情況

英特爾發(fā)布2023-2024企業(yè)社會(huì)責(zé)任報(bào)告
中科創(chuàng)達(dá)入選車載操作系統(tǒng)TOP10企業(yè)
匯川技術(shù)2023-2024年度信息披露評(píng)價(jià)榮獲A級(jí)
智現(xiàn)未來(lái)榮獲甲子光年“2023-2024年度科技產(chǎn)業(yè)最具投資價(jià)值企業(yè)”

評(píng)論