亚洲一区二区三区免费在线播放,超碰国产AV电影

2023年以來(lái)，越來(lái)越多車型開始接入大模型，越來(lái)越多Tier1推出汽車大模型解決方案。特斯拉FSD V12的出色進(jìn)展和SORA的推出，更加速了AI大模型在座艙和智駕領(lǐng)域的落地。

端到端自動(dòng)駕駛大模型的發(fā)展突飛猛進(jìn)

2023年2月，采用端到端自動(dòng)駕駛模型的特斯拉FSD v12.2.1已經(jīng)開始陸續(xù)在美開啟推送，不僅僅是員工和測(cè)試人員。根據(jù)首批客戶的反饋，F(xiàn)SD V12 相當(dāng)強(qiáng)大，讓以前不相信不敢用自動(dòng)駕駛的普通人也敢于使用FSD了。譬如，特斯拉 FSD V12 可繞行路邊積水，一位特斯拉的工程師評(píng)論說(shuō)：這種開法很難用明確的代碼來(lái)實(shí)現(xiàn)，但特斯拉的端到端方案幾乎毫不費(fèi)力地實(shí)現(xiàn)了。

自動(dòng)駕駛AI大模型的發(fā)展可以分為四個(gè)階段：

1.0時(shí)代就是在感知層面使用大模型（Transformer）；

2.0時(shí)代就是模塊化，感知規(guī)控決策都用大模型；

3.0時(shí)代就是端到端大模型(一“端”是傳感器的原始數(shù)據(jù)，另一“端”直接輸出駕駛動(dòng)作)；

4.0時(shí)代就是從垂直領(lǐng)域的人工智能走向通用領(lǐng)域的人工智能(AGI的世界模型)。

現(xiàn)在多數(shù)公司處于2.0時(shí)代。特斯拉FSD V12已處于3.0時(shí)代。其他主機(jī)廠和Tier1紛紛跟進(jìn)FSD V12的端到端大模型。2024年1 月 30 日，小鵬汽車宣布，小鵬的端到端模型下一步將會(huì)全面上車。據(jù)悉，蔚來(lái)和理想的“基于端到端”自動(dòng)駕駛模型也將在2024年上線。

FSD V12駕駛決策交由AI算法生成，用海量視頻數(shù)據(jù)訓(xùn)練出的端到端神經(jīng)網(wǎng)絡(luò)，替換掉了超過(guò)30萬(wàn)行C++代碼。FSD V12提供了一條有待驗(yàn)證的全新路徑，若得以走通，將對(duì)行業(yè)產(chǎn)生顛覆性影響。

2月16日，OpenAI發(fā)布文本生成視頻模型SORA，標(biāo)志著AI視頻應(yīng)用即將大規(guī)模應(yīng)用的前夜。SORA不僅支持通過(guò)文本或圖像生成長(zhǎng)達(dá)60秒的視頻，其視頻生成能力、復(fù)雜場(chǎng)景和角色生成能力、以及對(duì)物理世界模擬的能力，都顯著超越了之前的技術(shù)。

SORA和FSD V12都是通過(guò)視覺讓AI能夠理解甚至模擬真實(shí)的物理世界。Elon Mask認(rèn)為，“FSD 12和Sora不過(guò)是AI通過(guò)視覺認(rèn)知世界、理解世界上的兩個(gè)開花結(jié)果，F(xiàn)SD最終用于駕駛行為，Sora則是用來(lái)生成視頻?！?

SORA的爆火，進(jìn)一步證明了FSD V12的合理性。馬斯克稱「特斯拉已經(jīng)能夠制作真實(shí)世界視頻大約一年了」。

來(lái)源：Twitter

AI大模型快速演化，帶來(lái)全新機(jī)會(huì)

最近三年，自動(dòng)駕駛大模型經(jīng)歷了若干次的演化，領(lǐng)先車企的自動(dòng)駕駛系統(tǒng)幾乎每年要重寫一次。這也給后來(lái)者提供了切入機(jī)會(huì)。

CVPR2023上，商湯、OpenDriveLab、地平線等聯(lián)合發(fā)布的端到端的自動(dòng)駕駛算法UniAD，獲得了2023年的最佳論文。

2024年初，中科慧拓技術(shù)團(tuán)隊(duì)和中科院自動(dòng)化所共同提出的生成式端到端自動(dòng)駕駛模型GenAD，將生成式人工智能（Generative AI）和端到端自動(dòng)駕駛技術(shù)結(jié)合，是業(yè)界首個(gè)生成式端到端自動(dòng)駕駛模型。該技術(shù)顛覆了UniAD的漸進(jìn)式流程端到端方案，探討了一種新的端到端自動(dòng)駕駛范式，關(guān)鍵在于采用生成式人工智能的方式預(yù)測(cè)自車和周圍環(huán)境在過(guò)去場(chǎng)景中的時(shí)序演變方式。

來(lái)源：中科慧拓

2024年2月，地平線和華中科技大學(xué)提出了VADv2，一個(gè)基于概率規(guī)劃的端到端駕駛模型。VADv2以流方式輸入多視角圖像序列，將傳感器數(shù)據(jù)轉(zhuǎn)換為環(huán)境標(biāo)記嵌入，輸出動(dòng)作的概率分布，并從中采樣一個(gè)動(dòng)作來(lái)控制車輛。僅使用攝像頭傳感器，VADv2在CARLA Town05基準(zhǔn)測(cè)試中實(shí)現(xiàn)了最先進(jìn)的閉環(huán)性能，顯著優(yōu)于所有現(xiàn)有方法。它能夠在完全端到端的方式下穩(wěn)定運(yùn)行，甚至不需要基于規(guī)則的封裝。

來(lái)源：地平線

在Town05長(zhǎng)距離基準(zhǔn)測(cè)試中，VADv2取得了85.1的駕駛分?jǐn)?shù)，98.4的路程完成度，以及0.87的違規(guī)分?jǐn)?shù)，如表1所示。與之前的最先進(jìn)方法相比，VADv2在路程完成度更高的同時(shí)，顯著提高了駕駛分?jǐn)?shù)，增加了9.0。值得注意的是，VADv2僅使用攝像頭作為感知輸入，而DriveMLM同時(shí)使用了攝像頭和激光雷達(dá)。此外，與之前僅依賴攝像頭最佳方法相比，VADv2顯示出更大的優(yōu)勢(shì)，駕駛分?jǐn)?shù)的顯著提高達(dá)到了16.8。

來(lái)源：地平線

也是在2024年2月，清華大學(xué)交叉信息研究院和理想汽車提出了 DriveVLM。DriveVLM的整體流程如下圖所示。一系列圖像被大型視覺語(yǔ)言模型（VLM）處理，以執(zhí)行特定的鏈?zhǔn)剿季S（CoT）推理，得出駕駛規(guī)劃結(jié)果。這個(gè)大型VLM包括一個(gè)視覺編碼器和一個(gè)大型語(yǔ)言模型（LLM）。

來(lái)源：清華大學(xué)交叉信息研究院

由于VLMs在空間推理和高計(jì)算需求方面的局限性，DriveVLM團(tuán)隊(duì)又提出了DriveVLM-Dual，一個(gè)結(jié)合了DriveVLM與傳統(tǒng)自主駕駛流水線優(yōu)勢(shì)的混合系統(tǒng)。DriveVLM-Dual可選擇性地將DriveVLM與傳統(tǒng)的3D感知和規(guī)劃模塊相結(jié)合，例如3D目標(biāo)檢測(cè)器、占用網(wǎng)絡(luò)和運(yùn)動(dòng)規(guī)劃器，使系統(tǒng)能夠?qū)崿F(xiàn)3D定位和高頻規(guī)劃能力。這種雙重系統(tǒng)設(shè)計(jì)，類似于人腦的慢速和快速思考過(guò)程，能夠有效適應(yīng)駕駛場(chǎng)景中不斷變化的復(fù)雜性。

大模型興起，AI和云計(jì)算公司受關(guān)注

AI大模型興起，算力、算法和數(shù)據(jù)三者缺一不可。擅長(zhǎng)算法，儲(chǔ)備了大量算力的AI公司（如科大訊飛、商湯科技、曠視科技等），以及具備強(qiáng)大智算中心的云計(jì)算公司（如浪潮、火山引擎、騰訊云等）受到主機(jī)廠關(guān)注。

商湯在AI大模型領(lǐng)域布局了座艙多模態(tài)大模型SenseChat-Vision、AIDC智算中心（6000P算力）、自動(dòng)駕駛大模型DriveMLM。2024年初，商湯推出DriveMLM，在閉環(huán)測(cè)試最權(quán)威榜單CARLA上取得很好的成績(jī)。DriveMLM是介于模塊化和端到端方案之間的中間方案，具備可解釋性。

來(lái)源：商湯科技

在自動(dòng)駕駛的Corner Case采集上，火山引擎和毫末智行一起將大模型應(yīng)用在場(chǎng)景生成和標(biāo)注提效上。在火山引擎提供的云服務(wù)能力支持下，毫末DriveGPT大模型的預(yù)標(biāo)注，整體效率提升了10倍。

2023年，騰訊發(fā)布了在智能汽車云、智駕云圖、智能座艙等領(lǐng)域的升級(jí)產(chǎn)品和方案。算力方面，騰訊智能汽車云帶來(lái)3.2Tbps帶寬，算力性能提升3倍，通信性能提升10倍，計(jì)算集群GPU利用率提升60%以上，為智能駕駛大模型訓(xùn)練提供高帶寬、低延遲的智算能力支撐。

在訓(xùn)練加速方面，騰訊智能汽車云結(jié)合太極Angel訓(xùn)練加速框架，訓(xùn)練速度相比業(yè)界主流框架提高1倍，推理速度相比業(yè)界主流框架提升1.3倍。博世、蔚來(lái)汽車、英偉達(dá)、奔馳、文遠(yuǎn)知行等企業(yè)目前都是騰訊智能汽車云的用戶。2024年，騰訊將進(jìn)一步加強(qiáng)AI大模型的建設(shè)。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴