一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華&港大提出LanguageMPC:將大語言模型和MPC相結(jié)合的新型類人智駕系統(tǒng)

CVer ? 來源:CVer公眾號(hào) ? 2023-10-10 15:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

e7083db2-6741-11ee-939d-92fbcf53809c.png

面對(duì)復(fù)雜多變的交通場(chǎng)景,基于學(xué)習(xí)的方法已成為了實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛系統(tǒng)的主流方案。然而,基于學(xué)習(xí)的自動(dòng)駕駛系統(tǒng)仍面臨以下挑戰(zhàn):

對(duì)復(fù)雜的規(guī)則和獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)的需求使其在理解交通法規(guī)等高級(jí)信息上存在困難。

受限于數(shù)據(jù)量和采樣效率,處理罕見事件是其面臨的一大挑戰(zhàn)。

由于神經(jīng)網(wǎng)絡(luò)的黑盒特性,現(xiàn)有基于學(xué)習(xí)的自動(dòng)駕駛系統(tǒng)缺乏良好的可解釋性。

針對(duì)以上問題,我們提出將大語言模型(LLM)作為自動(dòng)駕駛系統(tǒng)的決策核心,利用LLM像人一樣思考的能力,將人類常識(shí)和推理能力作為自動(dòng)駕駛系統(tǒng)決策的指導(dǎo)。同時(shí),我們開發(fā)了將LLM給出的高層決策轉(zhuǎn)化為具體駕駛行為的方法,將高層決策與底層控制器無縫結(jié)合。

e71032b0-6741-11ee-939d-92fbcf53809c.png

在CVer微信公眾號(hào)后臺(tái)回復(fù):MPC,可以下載本論文pdf,學(xué)起來!

LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 論文:https://arxiv.org/abs/2310.03026 項(xiàng)目網(wǎng)站:https://sites.google.com/view/llm-mpc LanguageMPC:將大語言模型與模型預(yù)測(cè)控制無縫結(jié)合

e716c01c-6741-11ee-939d-92fbcf53809c.png

LanguageMPC首次將LLM應(yīng)用于駕駛場(chǎng)景,并設(shè)計(jì)了將文字形式高層決策轉(zhuǎn)化為可操作駕駛行為的方法。我們定量的證明了LanguageMPC在路口和環(huán)島等復(fù)雜交通場(chǎng)景中均優(yōu)于現(xiàn)有基于學(xué)習(xí)和基于優(yōu)化的自動(dòng)駕駛系統(tǒng)。同時(shí),我們還展示了LanguageMPC在應(yīng)對(duì)多車協(xié)同控制、文字輔助駕駛等復(fù)雜任務(wù)時(shí)的強(qiáng)大性能。

LanguageMPC的技術(shù)核心在于以下兩點(diǎn):

專用于駕駛場(chǎng)景的思維鏈框架。我們使用Langchain管理LLM,通過設(shè)計(jì)初始prompt和多種工具,指導(dǎo)LLM依次完成對(duì)周車的意圖判斷和注意力分配、判斷自車所處情景、給出駕駛動(dòng)作指引等任務(wù)。我們將整個(gè)駕駛?cè)蝿?wù)劃分為多個(gè)子任務(wù),并重新設(shè)計(jì)了場(chǎng)景信息組織方式,通過確保信息的簡(jiǎn)潔性來提升LLM的推理能力。

高層決策與模型預(yù)測(cè)控制銜接。我們?cè)O(shè)計(jì)了將文字形式的高層決策轉(zhuǎn)化為可操作的駕駛行為的方法。具體而言,我們根據(jù)LLM的選擇來重計(jì)算觀測(cè)矩陣,調(diào)整MPC的注意力分配;調(diào)整懲罰函數(shù)的參數(shù)矩陣,使用LLM給出的情景判斷指導(dǎo)MPC;將LLM的駕駛運(yùn)動(dòng)指引轉(zhuǎn)化為運(yùn)動(dòng)偏置,直接調(diào)整MPC的駕駛行為。

實(shí)驗(yàn)結(jié)果

定量實(shí)驗(yàn)

e71d9770-6741-11ee-939d-92fbcf53809c.png

我們的方法在幾乎所有指標(biāo)上都有明顯提升,并且顯著降低了碰撞幾率和總體Cost。

路口無保護(hù)左轉(zhuǎn)

在路口左轉(zhuǎn)時(shí),LanguageMPC能根據(jù)交通規(guī)則讓行對(duì)向直行車輛。

路口直行和變道超車

路口直行時(shí),LanguageMPC能遵守路口內(nèi)不超車的規(guī)則,并在到達(dá)車道內(nèi)后迅速超車。

多車聯(lián)合控制:窄路會(huì)車

e7323932-6741-11ee-939d-92fbcf53809c.png

LanguageMPC通過信息匯總和分別控制,實(shí)現(xiàn)了高效的多車聯(lián)合控制,完成窄路會(huì)車。

調(diào)控駕駛風(fēng)格

e745bb9c-6741-11ee-939d-92fbcf53809c.png

LanguageMPC能根據(jù)文字指引,簡(jiǎn)單直接的調(diào)控駕駛風(fēng)格。

文字指導(dǎo)駕駛

e753bfb2-6741-11ee-939d-92fbcf53809c.png

LanguageMPC在文字指引下避開了維修路段。

LanguageMPC在關(guān)鍵指標(biāo)上大大優(yōu)于現(xiàn)有方法,并能處理復(fù)雜的真實(shí)世界駕駛場(chǎng)景,可在各種駕駛場(chǎng)景中實(shí)現(xiàn)與人類類似的性能,其推理能力和可解釋性有助于克服當(dāng)前基于學(xué)習(xí)的駕駛輔助系統(tǒng)在適應(yīng)性和透明度方面的局限性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • MPC
    MPC
    +關(guān)注

    關(guān)注

    2

    文章

    36

    瀏覽量

    21476
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10802
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14326

    瀏覽量

    170751

原文標(biāo)題:清華&港大提出LanguageMPC:將大語言模型和MPC相結(jié)合的新型類人智駕系統(tǒng)

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【大語言模型:原理與工程實(shí)踐】大語言模型的應(yīng)用

    ,它通過抽象思考和邏輯推理,協(xié)助我們應(yīng)對(duì)復(fù)雜的決策。 相應(yīng)地,我們?cè)O(shè)計(jì)了兩任務(wù)來檢驗(yàn)大語言模型的能力。一是感性的、無需理性能力的任務(wù),類似于人類的
    發(fā)表于 05-07 17:21

    Simulink模型與Lego機(jī)器結(jié)合使用

    Simulink模型與Lego機(jī)器結(jié)合使用可提供令人愉悅的基于模型的設(shè)計(jì)體驗(yàn)支持LEGO MINDSTORMS NXT作為產(chǎn)品標(biāo)準(zhǔn)功能。
    發(fā)表于 12-20 07:15

    nesC編程語言在無線網(wǎng)絡(luò)傳感器設(shè)計(jì)中的應(yīng)用

    新型編程語言——nesC其最大的特點(diǎn)是,組件化/模塊化思想和基于事件驅(qū)動(dòng)的執(zhí)行模型相結(jié)合。現(xiàn)TinyOS操作
    發(fā)表于 07-02 12:00 ?2291次閱讀
    nesC編程<b class='flag-5'>語言</b>在無線網(wǎng)絡(luò)傳感器設(shè)計(jì)中的應(yīng)用

    動(dòng)靜態(tài)相結(jié)合LED顯示【C語言版】

    動(dòng)靜態(tài)相結(jié)合LED顯示【C語言版】動(dòng)靜態(tài)相結(jié)合LED顯示【C語言版】動(dòng)靜態(tài)相結(jié)合LED顯示【C語言
    發(fā)表于 12-29 15:51 ?0次下載

    知識(shí)圖譜與訓(xùn)練模型相結(jié)合和命名實(shí)體識(shí)別的研究工作

    本次分享ICLR2021中的三篇投遞文章,涉及知識(shí)圖譜與訓(xùn)練模型相結(jié)合和命名實(shí)體識(shí)別(NER)的研究工作。 文章概覽 知識(shí)圖譜和語言理解的聯(lián)合預(yù)訓(xùn)練(JAKET: Joint
    的頭像 發(fā)表于 03-29 17:06 ?4763次閱讀
    知識(shí)圖譜與訓(xùn)練<b class='flag-5'>模型</b><b class='flag-5'>相結(jié)合</b>和命名實(shí)體識(shí)別的研究工作

    AMP01 SPICE宏模型

    AMP01 SPICE宏模型
    發(fā)表于 04-14 08:52 ?0次下載
    <b class='flag-5'>AMP</b>01 SPICE宏<b class='flag-5'>模型</b>

    AMP02 SPICE宏模型

    AMP02 SPICE宏模型
    發(fā)表于 04-14 08:55 ?0次下載
    <b class='flag-5'>AMP</b>02 SPICE宏<b class='flag-5'>模型</b>

    基于場(chǎng)景聚和遺傳算法相結(jié)合模型求解算法

    針對(duì)新能源消納中儲(chǔ)能電源配置問題,基于隨機(jī)規(guī)劃理諗,建立了考慮霱求場(chǎng)景不確定性的儲(chǔ)能電源配置期望值模型提出基于場(chǎng)景聚和遺傳算法相結(jié)合模型
    發(fā)表于 04-16 11:34 ?2次下載
    基于場(chǎng)景聚<b class='flag-5'>類</b>和遺傳算法<b class='flag-5'>相結(jié)合</b>的<b class='flag-5'>模型</b>求解算法

    知識(shí)圖譜與BERT相結(jié)合助力語言模型

    感謝清華大學(xué)自然語言處理實(shí)驗(yàn)室對(duì)預(yù)訓(xùn)練語言模型架構(gòu)的梳理,我們沿此脈絡(luò)前行,探索預(yù)訓(xùn)練語言
    的頭像 發(fā)表于 05-19 15:47 ?4107次閱讀
    知識(shí)圖譜與BERT<b class='flag-5'>相結(jié)合</b>助力<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    AMP01 SPICE宏模型

    AMP01 SPICE宏模型
    發(fā)表于 06-17 15:53 ?0次下載
    <b class='flag-5'>AMP</b>01 SPICE宏<b class='flag-5'>模型</b>

    AMP02 SPICE宏模型

    AMP02 SPICE宏模型
    發(fā)表于 06-17 15:55 ?2次下載
    <b class='flag-5'>AMP</b>02 SPICE宏<b class='flag-5'>模型</b>

    存儲(chǔ)&amp;作用域&amp;生命周期&amp;鏈接屬性

    、鏈接屬性前言本篇文章將會(huì)為大家介紹一些變量相關(guān)的存儲(chǔ)屬性、作用域、生命周期以及鏈接屬性的一些知識(shí),有助于大家更好地理解程序,分析程序。一、存儲(chǔ)&amp;amp;作用域&amp;
    發(fā)表于 12-09 15:51 ?5次下載
    存儲(chǔ)<b class='flag-5'>類</b>&<b class='flag-5'>amp</b>;作用域&<b class='flag-5'>amp</b>;生命周期&<b class='flag-5'>amp</b>;鏈接屬性

    大&amp;amp;騰訊提出DiffusionDet:第一個(gè)用于目標(biāo)檢測(cè)的擴(kuò)散模型

    近日,來自香港大學(xué)的羅平團(tuán)隊(duì)、騰訊 AI Lab 的研究者聯(lián)合提出一種新框架 DiffusionDet,擴(kuò)散模型應(yīng)用于目標(biāo)檢測(cè)。據(jù)了解,還沒有研究可以成功地擴(kuò)散
    的頭像 發(fā)表于 11-22 15:35 ?2455次閱讀

    如何區(qū)分Java中的&amp;amp;和&amp;amp;&amp;amp;

    首先給i賦值為0,如果i大于10,并且i++等于1,則輸出“錯(cuò)誤”和i的值。否則輸出“正確”和i的值。分別用&amp;和&amp;&amp;運(yùn)行,觀察運(yùn)行結(jié)果的不同。
    的頭像 發(fā)表于 02-24 10:46 ?1954次閱讀
    如何區(qū)分Java中的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;和&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;

    IU8689帶主從模式,145W單聲道&amp;amp;amp;2X75W立體聲D音頻功放

    IU8689帶主從模式,145W單聲道&amp;amp;2X75W立體聲D音頻功放
    的頭像 發(fā)表于 03-23 20:24 ?2284次閱讀
    IU8689帶主從模式,145W單聲道&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;2X75W立體聲D<b class='flag-5'>類</b>音頻功放