一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

純視覺自動駕駛如何理解路邊畫報上的人?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-05-19 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]之前看到過一個非常有趣的新聞,那就是貼有董明珠海報的公交車經過十字路口時,被“行人闖紅燈曝光臺”識別到,并誤以為董明珠闖紅燈了??此埔粋€茶余飯后閑聊的話題,對于自動駕駛行業(yè)來說,其實是一個值得深思的問題。隨著自動駕駛技術下沉到消費市場,基于純視覺的自動駕駛系統(tǒng)就是依托于車載攝像頭來識別路況,如果遇到了類似海報上的人,尤其是遇到了與真人大小類似的人物海報,自動駕駛系統(tǒng)將如何理解?

其實在純視覺的自動駕駛系統(tǒng)中,攝像頭就像汽車的“眼睛”,負責不停地拍下周圍的風景,然后把這些畫面交給車上的“大腦”——也就是各種算法和模型(決策系統(tǒng)),來判斷前方有沒有行人、車輛或障礙物。當汽車只靠攝像頭“看世界”時,無論是真人、雕像,還是貼在墻上的海報、廣告牌,都可以被它同樣地“看到”,但這一切都只是二維的像素點。如果車上的“腦子”誤把一張畫得惟妙惟肖的海報人物當成了真實行人,它是否會不由自主地踩下剎車,甚至緊急停車?

要讓純視覺系統(tǒng)分清畫報上的“假人”和馬路上真正走動的行人,其實要從硬件和軟件兩條路同時發(fā)力。現階段為了確保自動駕駛的安全性,很多車企都會選擇在攝像頭旁邊再裝一臺雷達或激光雷達(基于激光雷達的自動駕駛方案)。雷達發(fā)射電磁波,激光雷達發(fā)射激光脈沖,不同于攝像頭只“看到”表面紋理,這些傳感器能直接給出物體到車身的距離。海報只是貼在墻上的一層薄薄的紙,它在雷達或激光雷達里幾乎沒有回波,汽車就能立刻判斷:“哦,這不是立體的人,是個平面的東西?!钡艹杀竞涂臻g限制,量產車型并不總能一開始就配齊這些高精度傳感器。

在只依賴攝像頭的情況下,軟件層面的改進更顯關鍵。最先要做的,就是讓攝像頭拍到的畫面經過更聰明的“人形檢測”算法。目標檢測模型通常會先在圖像上劃出許多小方框,然后再判斷每個方框里是不是人。早期的做法像給照片打了“九宮格”,一點一點地掃;現在用深度學習的大腦,能一次性在不同大小的區(qū)域上同時判斷,大幅提高了速度和準確率。但是這些大腦都是在大量真實行人的照片或視頻上訓練出來的,對海報、畫報這樣專門制作的人像平面并不陌生,因為它們往往長得和真人太像了,于是就容易“見人就當真人”。

為了解決這個問題,就會讓模型在訓練時多“看”一些海報、廣告、櫥窗人像的畫面,把它們當作“負樣本”喂給大腦,告訴它們“雖然這個區(qū)域里有一個人形,但它總是貼在同一個地方,不會移動,也不會有立體的深度變化”。這樣,模型在識別“行人”時,就能多留一個心眼,如果它在連續(xù)的畫面里每一幀都在同一個位置出現,而且旁邊沒有地面陰影、腳步移動產生的微小抖動,就可能是個海報,而不是一個真正走路的人。

除了讓模型學得更聰明,純視覺系統(tǒng)還會利用“深度估計”技術來給每個像素預測一個距離值。想象一下,如果你只用單只眼睛看東西,也能憑借物體大小、透視關系估計遠近。深度估計網絡就是這么一回事,它會結合數萬張配有真實距離標注的照片,學會從平面圖像里猜距離。問題是,海報和背景是一體的平面,網絡有時候也會誤以為海報里的“人”是在幾米外的真實行人。為此,工程師們會在車上裝兩臺攝像頭或雙目攝像頭,前后或左右分開約幾十厘米,模仿我們人眼的工作原理,通過左右圖像的微小差別(視差),直接算出距離。對于真正立體的行人,視差足夠明顯;對于緊貼墻面的廣告,其視差幾乎為零,這時系統(tǒng)就能判定它是個平面。

更進一步的時,系統(tǒng)會追蹤每個“人”在多幀畫面中的運動軌跡。真的行人會自己動,每一步都帶來位置和形狀的微妙變化;而海報里的“人”只會隨著車子的移動在畫面里平移、縮放,卻不會產生獨立運動?,F在主要采用一種叫“多目標跟蹤”(MultiObject Tracking)的技術,把每個檢測到的人都打上標簽,然后觀察它在時間軸上是如何變化。如果某個標簽在反復觀察中,從來沒有過正常的人行運動,那么它的“行人”置信度就會被一幀一幀地降低,最終被系統(tǒng)忽略。

為了讓純視覺系統(tǒng)更早地識別出海報,很多車企還會選擇在車輛首次經過某條路段時,自動繪制一張“靜態(tài)地圖”(高精度地圖),記錄下兩旁那些看起來像人卻不怎么動的畫面位置。這樣,車輛再次行駛同一路線時,就不用每次都去重新判斷,而是把這些已知的靜止“假人”從一開始就屏蔽掉,節(jié)省計算資源,也避免了重復誤判。

盡管這些算法在實驗室和小范圍測試中已經取得了不錯效果,但陽光直射、雨雪天氣、夜晚路燈閃爍等復雜情況,仍然會讓純視覺系統(tǒng)偶爾“犯迷糊”。為此還會在虛擬仿真平臺(比如CARLA、LG SVL)里,模擬各種極端光照和天氣條件,讓系統(tǒng)先在虛擬世界里“吃透”可能遇到的畫面,再到真實道路上進行測試和驗證。

隨著“視覺大模型”(類似自然語言領域的GPT大模型)逐漸走向成熟,純視覺方案將擁有更強的“常識推理”能力。它們不僅能看出圖像里有人,還能結合場景理解。海報一般固定在墻面、廣告牌上不會突然移動,也不會投下隨行人的腳部陰影。這樣一來,汽車的大腦就像多了常識一樣,能夠更好地區(qū)分“畫報上的人”和真正的行人。

要讓純視覺自動駕駛系統(tǒng)既能敏銳地發(fā)現真實行人,又不會被路邊的海報嚇得亂剎車,其實需要軟硬件多方面的配合。加裝雷達或雙目攝像頭、利用深度估計、時空跟蹤、靜態(tài)語義地圖和負樣本訓練,都是在讓汽車“更聰明”地看世界。未來,當城市的路燈、路側基站也都能把靜態(tài)障礙信息實時廣播給車輛時,純視覺自動駕駛就能像人一樣,用“眼睛+大腦”配合得更默契,真正做到在復雜的城市環(huán)境中,自信而平穩(wěn)地前行,再也不用擔心那些“畫報上的人”會誤導它。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4710

    瀏覽量

    95427
  • 自動駕駛
    +關注

    關注

    790

    文章

    14323

    瀏覽量

    170721
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛汽車如何正確進行道路識別?

    識別不僅僅是簡單地判斷車輛是否在車道中心行駛,更涉及到對車道線、交通標志、道路邊緣以及其他道路要素的綜合感知與理解。 傳感器硬件 傳感器硬件是自動駕駛道路識別的基礎,當前主流的傳感器包括攝像頭、激光雷達(LiDAR)
    的頭像 發(fā)表于 06-29 09:40 ?721次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何正確進行道路識別?

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術要求上有何不同?

    ,自動駕駛技術也得到了充足的應用,但因應用場景不同,技術的側重方向也有所區(qū)別。今天就來和大家聊一聊這個話題。 應用場景:開放道路vs封閉場地 首先要理解的是,自動駕駛所面對的環(huán)境決定了它的技術基礎。乘用車
    的頭像 發(fā)表于 06-28 11:38 ?213次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術要求上有何不同?

    自動駕駛視覺方案到底有哪些弊端?

    [首發(fā)于智駕最前沿微信公眾號]隨著人工智能與傳感器技術的快速發(fā)展,自動駕駛汽車逐步走入公眾視野。其中,關于感知系統(tǒng)的技術路線選擇,始終是大家爭論的焦點。尤其是“視覺方案”,也就是主要依賴攝像頭進行
    的頭像 發(fā)表于 06-23 09:27 ?222次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>純</b><b class='flag-5'>視覺</b>方案到底有哪些弊端?

    視覺自動駕駛會有哪些安全問題?

    強調視覺系統(tǒng)的先進性。視覺自動駕駛是指在車輛自動駕駛系統(tǒng)中僅依賴攝像頭而不使用激光雷達或毫米波雷達等主動傳感器。特斯拉率先倡導這一路線,宣
    的頭像 發(fā)表于 06-16 09:56 ?246次閱讀
    <b class='flag-5'>純</b><b class='flag-5'>視覺</b>的<b class='flag-5'>自動駕駛</b>會有哪些安全問題?

    自動駕駛視覺替代不了激光雷達?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術的不斷發(fā)展,視覺和激光雷達(LiDAR)兩種主流環(huán)境感知成為了大家的熱議話題?;跀z像頭的“視覺
    的頭像 發(fā)表于 06-11 09:06 ?280次閱讀

    2024年自動駕駛行業(yè)熱點技術盤點

    感知輕地圖以及視覺等。這些技術的出現,也代表著自動駕駛正從概念走向現實,今天就給大家來盤點2024年自動駕駛行業(yè)出現的那些技術熱點! ? 城市NOA:邁向精細化
    的頭像 發(fā)表于 01-14 10:48 ?626次閱讀

    馬斯克重申:視覺自動駕駛的未來

    近日,特斯拉始終堅持其獨特的視覺感知系統(tǒng)。這一系統(tǒng)摒棄了傳統(tǒng)的毫米波雷達,完全依賴于攝像頭與先進的人工神經網絡,以實現自動駕駛的功能。 特斯拉CEO埃隆·馬斯克近期再次就
    的頭像 發(fā)表于 12-04 14:09 ?846次閱讀

    自動駕駛技術的典型應用 自動駕駛技術涉及到哪些技術

    自動駕駛技術的典型應用 自動駕駛技術是一種依賴計算機、無人駕駛設備以及各種傳感器,實現汽車自主行駛的技術。它通過使用人工智能、視覺計算、雷達、監(jiān)控裝置和全球定位系統(tǒng)等技術,使
    的頭像 發(fā)表于 10-18 17:31 ?1912次閱讀

    激光雷達與視覺方案,哪個才是自動駕駛最優(yōu)選?

    主要分為兩大類:激光雷達與視覺感知。激光雷達因其能夠提供精確的距離和形狀信息,在自動駕駛技術早期的開發(fā)中被廣泛應用。然而,隨著計算機視覺技術的飛速進步,基于攝像頭的
    的頭像 發(fā)表于 09-29 10:47 ?1166次閱讀

    特斯拉智能駕駛|從視覺優(yōu)先的技術路徑到未來的挑戰(zhàn)?

    特斯拉作為全球智能駕駛領域的技術先鋒,其FSD(Full Self-Driving)方案選擇了獨特的視覺自動駕駛路線,摒棄了激光雷達和高精度地圖的使用。特斯拉通過其自研的攝像頭感知方
    的頭像 發(fā)表于 09-12 08:57 ?4713次閱讀
    特斯拉智能<b class='flag-5'>駕駛</b>|從<b class='flag-5'>視覺</b>優(yōu)先的技術路徑到未來的挑戰(zhàn)?

    聊聊自動駕駛離不開的感知硬件

    自動駕駛飛速發(fā)展,繞不開感知、決策和控制決策的經典框架,而感知作為自動駕駛汽車“感官”的重要組成部分,決定了自動駕駛系統(tǒng)對環(huán)境的理解和反應能力。為了讓
    的頭像 發(fā)表于 08-23 10:18 ?1167次閱讀

    FPGA在自動駕駛領域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現場可編程門陣列)在自動駕駛領域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術中不可或缺的一部分。以下是FPGA在自動駕駛
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領域有哪些應用?

    控制。在視覺算法方面,FPGA利用自身并行處理和高速存儲器的特點,極大地加快了算法的執(zhí)行速度,提高了運算效率。 五、未來發(fā)展趨勢隨著自動駕駛技術的不斷發(fā)展,FPGA在自動駕駛領域的應用將會更加廣泛
    發(fā)表于 07-29 17:09

    自動駕駛識別技術有哪些

    自動駕駛的識別技術是自動駕駛系統(tǒng)中的重要組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。自動駕駛識別技術主要包括多種傳感器及其融合技術,以及基于這些傳感器數據的處理和識別算
    的頭像 發(fā)表于 07-23 16:16 ?1506次閱讀

    自動駕駛的傳感器技術介紹

    自動駕駛的傳感器技術是自動駕駛系統(tǒng)的核心組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。以下是對自動駕駛傳感器技術的詳細介紹,內容涵蓋常見類型、工作原理、在
    的頭像 發(fā)表于 07-23 16:08 ?3245次閱讀