一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)預(yù)測(cè)研究

地平線HorizonRobotics ? 來(lái)源:地平線HorizonRobotics ? 2025-04-01 10:32 ? 次閱讀

混合模型(Mixture Models)是一種強(qiáng)大的工具,能夠有效表征多模態(tài)分布(Multimodality)。根據(jù)正組分(Positive Mixture Component)匹配方式,主流的混合模型方法主要分為兩類:基于錨點(diǎn)(Anchor-Based)匹配和基于預(yù)測(cè)(Prediction-Based)匹配。然而,Prediction-Based方法存在預(yù)測(cè)聚類現(xiàn)象,難以選擇具有代表性的預(yù)測(cè)結(jié)果;而Anchor-Based方法則回歸精度受限。

本文提出了一種全新的混合模型正組分匹配范式:可更新且具區(qū)分度錨點(diǎn)(EDA,Evolvingand Distinct Anchors),巧妙結(jié)合上述兩類方法的優(yōu)勢(shì),實(shí)現(xiàn)更高效的多峰分布學(xué)習(xí)。我們?cè)诙嗄B(tài)運(yùn)動(dòng)預(yù)測(cè)(Multimodal Motion Prediction)任務(wù)上進(jìn)行了廣泛實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,EDA方法(單模型)在Waymo Motion Prediction Challenge中展現(xiàn)了優(yōu)秀的性能。

? 原文鏈接:

https://ojs.aaai.org/index.php/AAAI/article/view/28130

?代碼鏈接:

https://github.com/Longzhong-Lin/EDA

多模態(tài)運(yùn)動(dòng)預(yù)測(cè)

自動(dòng)駕駛領(lǐng)域,運(yùn)動(dòng)預(yù)測(cè) (Motion Prediction) 是一個(gè)重要任務(wù),它有助于場(chǎng)景理解和安全決策。該任務(wù)利用歷史狀態(tài)和道路地圖來(lái)預(yù)測(cè)目標(biāo)智能體的未來(lái)軌跡。其主要挑戰(zhàn)來(lái)自未來(lái)行為的多模態(tài)性 (Multimodality) ,即智能體在相同環(huán)境和狀態(tài)下可能展現(xiàn)出多種不同的行為模式。

e2bbf944-0bbc-11f0-9310-92fbcf53809c.png

圖表1 智能體在相同環(huán)境和狀態(tài)下可能展現(xiàn)出多種不同的行為模式

混合模型與正樣本匹配

近年來(lái),混合模型 (Mixture Model)例如高斯混合模型 (GMM) 已成為表征多峰未來(lái)行為分布的主流方法。混合模型通常采用“贏家通吃”的回歸損失和分類損失,這需要明確混合組分 (Mixture Component) 中的正負(fù)樣本,來(lái)作為分類損失的標(biāo)簽,以及計(jì)算正組分對(duì)應(yīng)預(yù)測(cè)軌跡的回歸損失。那么根據(jù)正樣本匹配的方式,當(dāng)前主流的混合模型方法可以分為兩類:基于預(yù)測(cè) (Prediction-Based)匹配和基于錨點(diǎn) (Anchor-Based)匹配。

Prediction-Based / Anchor-Free選擇與真實(shí)軌跡 (Ground Truth) 最接近的預(yù)測(cè)軌跡,將其所對(duì)應(yīng)的混合組分作為正樣本。這類方法生成的預(yù)測(cè)結(jié)果能夠真實(shí)反映未來(lái)行為的高度不確定性,但生成的軌跡往往會(huì)聚集在最有可能的區(qū)域,且具有相似的得分。這種現(xiàn)象導(dǎo)致模型難以選擇具有代表性的軌跡,不利于下游任務(wù)。

Anchor-Based:將各個(gè)混合組分與預(yù)定義的錨點(diǎn) (Anchor) 相關(guān)聯(lián),并選擇與Ground Truth最接近的錨點(diǎn)所對(duì)應(yīng)組分作為正樣本。錨點(diǎn)的引入顯著降低了分類(即給混合組分評(píng)分)的優(yōu)化難度,同時(shí)預(yù)測(cè)軌跡將傾向于生成在對(duì)應(yīng)的錨點(diǎn)附近。為了降低計(jì)算成本并保證評(píng)分性能,錨點(diǎn)的分布通常會(huì)比Prediction-Based方法生成的軌跡更稀疏,這種稀疏性則限制了模型的軌跡回歸能力。

e2cc2d46-0bbc-11f0-9310-92fbcf53809c.png

圖表2 不同正樣本匹配范式的結(jié)果

可更新且具區(qū)分度錨點(diǎn) (EDA)

在本文中,我們提出了一種全新的混合模型正樣本匹配范式:可更新且具區(qū)分度錨點(diǎn) (EDA, Evolving and Distinct Anchors)。

e2dd5328-0bbc-11f0-9310-92fbcf53809c.png

圖表3 EDA:全新的混合模型正樣本匹配范式

可更新錨點(diǎn) (Evolving Anchors)

對(duì)于Evolving Anchors,我們引入錨點(diǎn)并通過(guò)中間預(yù)測(cè)結(jié)果對(duì)其進(jìn)行動(dòng)態(tài)更新,使錨點(diǎn)能夠根據(jù)具體場(chǎng)景上下文信息進(jìn)行自適應(yīng)調(diào)整,從而在保留空間先驗(yàn)的同時(shí)提升了模型的靈活性。

e2f57aca-0bbc-11f0-9310-92fbcf53809c.png

圖4 Evolving Anchors的作用

具區(qū)分度錨點(diǎn) (Distinct Anchors)

隨著錨點(diǎn)的動(dòng)態(tài)更新,我們觀察到了類似Prediction-Based方法的預(yù)測(cè)結(jié)果聚集現(xiàn)象。

e303fa78-0bbc-11f0-9310-92fbcf53809c.png

圖表5 Evolving Anchors中的預(yù)測(cè)軌跡聚集現(xiàn)象

為了緩解預(yù)測(cè)聚集引發(fā)的分類標(biāo)簽歧義性問(wèn)題(即對(duì)于相近的2個(gè)組分,有可能一個(gè)被標(biāo)記為正樣本,而另一個(gè)被標(biāo)記為負(fù)樣本),我們借鑒目標(biāo)檢測(cè)領(lǐng)域中的DDQ方法,提出先從錨點(diǎn)中篩選出Distinct Anchors,再將這些錨點(diǎn)與Ground Truth進(jìn)行匹配。

e315a156-0bbc-11f0-9310-92fbcf53809c.png

圖表6 可更新且具區(qū)分度錨點(diǎn) (EDA, Evolving and Distinct Anchors)

實(shí)驗(yàn)結(jié)果

消融實(shí)驗(yàn)

隨著錨點(diǎn)更新頻率的增加,模型的回歸能力在逐步增長(zhǎng),并且錨點(diǎn)的每次更新都會(huì)帶來(lái)顯著的回歸精度提升。

e323c984-0bbc-11f0-9310-92fbcf53809c.png

圖表7 隨著錨點(diǎn)更新頻率的增加,模型的回歸能力在逐步提升

軌跡聚集問(wèn)題確實(shí)影響了Evolving Anchors的軌跡評(píng)分能力,導(dǎo)致模型的Top-6軌跡預(yù)測(cè)指標(biāo)尤其是mAP (mean Average Precision) 出現(xiàn)衰減;而Distinct Anchors的引入則如預(yù)期一樣,全面且顯著地提升了模型的Top-6軌跡預(yù)測(cè)指標(biāo)。

e32e9846-0bbc-11f0-9310-92fbcf53809c.png

圖表8 消融模型的Top-6指標(biāo)

對(duì)比實(shí)驗(yàn)

在Waymo Open Motion Dataset上,EDA的單模型表現(xiàn)超越了之前的Ensemble-Free方法,在所有指標(biāo)上均優(yōu)于基線模型MTR,特別是在Miss Rate上實(shí)現(xiàn)了13.5%的相對(duì)降低。此外,EDA還超越了MTR++,后者為改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)的MTR升級(jí)方法。

e345f6c6-0bbc-11f0-9310-92fbcf53809c.png

圖標(biāo)9 Benchmark結(jié)果

總結(jié)與展望

本文針對(duì)軌跡預(yù)測(cè)中Mixture Model存在模態(tài)坍縮和精度不足的問(wèn)題進(jìn)行了研究,提出了一種新的正負(fù)樣本匹配策略——Evolving and Distinct Anchors來(lái)解決該問(wèn)題,保證了軌跡預(yù)測(cè)模型在具備較高模態(tài)豐富度的同時(shí)擁有很高的歸回精度。我們的方法在Waymo Open Motion Dataset上達(dá)到了SOTA的水平。我們認(rèn)為正負(fù)樣本匹配策略具有很高的研究?jī)r(jià)值,不僅僅是在軌跡預(yù)測(cè)任務(wù)上,在端到端軌跡規(guī)劃、智能體行為仿真等任務(wù)上也具備廣泛的應(yīng)用潛力和重要的研究意義。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3464

    瀏覽量

    49817
  • 混合模型
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    6489
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14128

    瀏覽量

    168849

原文標(biāo)題:開發(fā)者說(shuō) | EDA:采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)預(yù)測(cè)

文章出處:【微信號(hào):horizonrobotics,微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于模態(tài)語(yǔ)義SLAM框架

    本文提出了一個(gè)魯棒快速的模態(tài)語(yǔ)義 SLAM 框架,旨在解決復(fù)雜和動(dòng)態(tài)環(huán)境中的 SLAM 問(wèn)題。具體來(lái)說(shuō),將僅幾何聚類和視覺(jué)語(yǔ)義信息相結(jié)合,以減少由于小尺度對(duì)象、遮擋和運(yùn)動(dòng)模糊導(dǎo)致的
    的頭像 發(fā)表于 08-31 09:39 ?2000次閱讀

    HT for Web (Hightopo) 使用心得(3)- 吸附與點(diǎn)

    吸附,顧名思義,是一個(gè)節(jié)點(diǎn)吸附到另一個(gè)節(jié)點(diǎn)上。就像船底的貝類一樣,通過(guò)吸附到船身,在船移動(dòng)的時(shí)候自己也會(huì)跟著移動(dòng);而點(diǎn),則決定了哪個(gè)位置是該節(jié)點(diǎn)的坐標(biāo)點(diǎn)位置。這里繼續(xù)以船舶為例,點(diǎn)
    的頭像 發(fā)表于 10-12 10:44 ?1209次閱讀
    HT for Web (Hightopo) 使用心得(3)- 吸附與<b class='flag-5'>錨</b><b class='flag-5'>點(diǎn)</b>

    【「身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.身智能機(jī)器人大模型

    近年來(lái),人工智能領(lǐng)域的大模型技術(shù)在多個(gè)方向上取得了突破性的進(jìn)展,特別是在機(jī)器人控制領(lǐng)域展現(xiàn)出了巨大的潛力。在“身智能機(jī)器人大模型”部分,作者研究并探討了大模型如何提升機(jī)器人的能力,大模型存在
    發(fā)表于 12-29 23:04

    體驗(yàn)MiniCPM-V 2.6 模態(tài)能力

    模態(tài)組網(wǎng)
    jf_23871869
    發(fā)布于 :2025年01月20日 13:40:48

    桿與圍巖加載過(guò)程紅外特征研究

    【作者】:籍遠(yuǎn)明;【來(lái)源】:《光譜學(xué)與光譜分析》2010年03期【摘要】:應(yīng)用紅外熱像技術(shù),對(duì)桿與圍巖加載變化破壞過(guò)程中的紅外輻射現(xiàn)象進(jìn)行了實(shí)驗(yàn)研究,結(jié)果表明:應(yīng)力峰值前,隨著荷載的增加,紅外輻射
    發(fā)表于 04-22 11:33

    5G傳輸點(diǎn)創(chuàng)新方案分析及研究

    的分析及研究,并在廣深5G實(shí)驗(yàn)網(wǎng)時(shí)進(jìn)行實(shí)驗(yàn),點(diǎn)在保持傳輸網(wǎng)絡(luò)穩(wěn)定、節(jié)省傳輸及機(jī)房投資、減少建設(shè)阻力、節(jié)省運(yùn)營(yíng)成本等有著明顯的效果,主要評(píng)估如下: ?。?)TCO效果明顯。采用
    發(fā)表于 12-03 15:04

    動(dòng)態(tài)可更新分布式監(jiān)測(cè)系統(tǒng)設(shè)計(jì)

    提出了一個(gè)動(dòng)態(tài)可更新的分布式監(jiān)測(cè)系統(tǒng)DDMS的設(shè)計(jì)思想*并實(shí)現(xiàn)了適用于WINDOWS平臺(tái)的版本DDMS采用了AGENT模型*以探針獨(dú)立化和監(jiān)測(cè)過(guò)程服務(wù)化為基礎(chǔ)*通過(guò)動(dòng)態(tài)更新協(xié)議實(shí)現(xiàn)了系統(tǒng).探針和
    發(fā)表于 06-28 18:03 ?14次下載
    動(dòng)態(tài)<b class='flag-5'>可更新</b>分布式監(jiān)測(cè)系統(tǒng)設(shè)計(jì)

    文化場(chǎng)景下的模態(tài)情感識(shí)別

    學(xué)習(xí)的特征,并通過(guò)多模態(tài)融合方法結(jié)合不同的模態(tài)。比較不同單模態(tài)特征和模態(tài)特征融合的情感識(shí)別性能.我們?cè)贑HEAVD中文
    發(fā)表于 12-18 14:47 ?0次下載

    預(yù)應(yīng)力連接器的知識(shí)

    預(yù)應(yīng)力應(yīng)考慮等級(jí)分類張拉、補(bǔ)張拉和釋放壓力預(yù)應(yīng)力的規(guī)定。鋼筋錨固好幾根預(yù)應(yīng)力筋的預(yù)應(yīng)力,除需有整束張拉的特性外,尚宜具備單條張拉的概率。
    發(fā)表于 08-13 11:10 ?6417次閱讀

    研發(fā)全新模態(tài)感知AI框架 AI能同時(shí)模擬人眼和手預(yù)測(cè)物體運(yùn)動(dòng)

    據(jù)外媒VentureBeat報(bào)道,來(lái)自三星、麥吉爾大學(xué)和約克大學(xué)的研究人員,近日研發(fā)出一個(gè)全新的生成式模態(tài)感知AI框架,能夠根據(jù)物體初始狀態(tài)的視覺(jué)和觸覺(jué)數(shù)據(jù),來(lái)預(yù)測(cè)出物體的
    的頭像 發(fā)表于 02-12 09:12 ?3323次閱讀
    研發(fā)全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>感知AI框架 AI能同時(shí)模擬人眼和手<b class='flag-5'>預(yù)測(cè)</b>物體<b class='flag-5'>運(yùn)動(dòng)</b>

    基于類間區(qū)分度的屬性約簡(jiǎn)方法及其研究

    近似集的變化,卻忽略了不具有等價(jià)關(guān)系的對(duì)象所在的不同類簇間關(guān)系的變化情況。因此,引入了類間區(qū)分度的概念,相較于等價(jià)類和上下近似集而言,它可以反映類簇區(qū)分程度隨屬性變化而變化的情況。對(duì)類間重合度和類間區(qū)分度進(jìn)
    發(fā)表于 05-25 16:50 ?2次下載

    如何利用LLM做模態(tài)任務(wù)?

    大型語(yǔ)言模型LLM(Large Language Model)具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力,但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4備圖片理解能力,但目前還未開放模態(tài)輸入接口并且不會(huì)透露任何模型上技術(shù)細(xì)節(jié)
    的頭像 發(fā)表于 05-11 17:09 ?1078次閱讀
    如何利用LLM做<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>任務(wù)?

    更強(qiáng)更通用:智源「悟道3.0」Emu模態(tài)大模型開源,在模態(tài)序列中「補(bǔ)全一切」

    當(dāng)前學(xué)界和工業(yè)界都對(duì)模態(tài)大模型研究熱情高漲。去年,谷歌的 Deepmind 發(fā)布了模態(tài)視覺(jué)語(yǔ)言模型 Flamingo ,它使用單一視覺(jué)語(yǔ)
    的頭像 發(fā)表于 07-16 20:45 ?873次閱讀
    更強(qiáng)更通用:智源「悟道3.0」Emu<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型開源,在<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>序列中「補(bǔ)全一切」

    基于模態(tài)學(xué)習(xí)的虛假新聞檢測(cè)研究

    目前,單流架構(gòu)模型在視頻分類、情感分析、圖像生成等模態(tài)領(lǐng)域中得以廣泛應(yīng)用,單流模型具有結(jié)構(gòu)簡(jiǎn)單、容易實(shí)現(xiàn)、高準(zhǔn)確率等優(yōu)勢(shì),在虛假新聞檢測(cè)領(lǐng)域中,是一個(gè)極具潛力的研究方向。
    的頭像 發(fā)表于 09-11 16:26 ?3011次閱讀
    基于<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>學(xué)習(xí)的虛假新聞檢測(cè)<b class='flag-5'>研究</b>

    人工智能領(lǐng)域模態(tài)的概念和應(yīng)用場(chǎng)景

    隨著人工智能技術(shù)的不斷發(fā)展,模態(tài)成為了一個(gè)備受關(guān)注的研究方向。模態(tài)技術(shù)旨在將不同類型的數(shù)據(jù)和信息進(jìn)行融合,以實(shí)現(xiàn)更加準(zhǔn)確、高效的人工智能
    的頭像 發(fā)表于 12-15 14:28 ?1.2w次閱讀