一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺中的雙目立體視覺和體積度量

新機(jī)器視覺 ? 來源:AI公園 ? 作者:Yauheni Marushko ? 2022-08-19 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

一個雙目立體視覺的常用應(yīng)用場景的介紹,很基礎(chǔ)。

立體視覺

立體視覺意味著人工智能可以通過一對相機(jī)來感知圖像的深度以及物體的距離。大多數(shù)三維相機(jī)模型都是基于立體視覺理論和技術(shù)的。兩臺攝像機(jī)之間設(shè)置一定的距離,這樣它們就可以從不同的角度“看”物體。評估兩個圖像之間的對應(yīng)關(guān)系,人工智能確定到目標(biāo)的距離,分析,并建立目標(biāo)的3D結(jié)構(gòu)。

采用立體視覺,不需要紅外傳感器、聲波定位儀、激光雷達(dá)等測距傳感器,可大大降低了技術(shù)解決方案的成本。

271dd538-1f81-11ed-ba43-dac502259ad0.png

主要應(yīng)用場景:

1、人體姿態(tài)和手勢識別。

2、3D模型和3D場景的構(gòu)建。

3、自動駕駛系統(tǒng)的障礙定位和檢測。

每個特定的場景都可以改動以解決特定的問題。因此,3D場景重建可以用來測量物體或產(chǎn)品的體積。

在實(shí)踐中,立體視覺通過兩臺攝像機(jī)分四個階段實(shí)現(xiàn):

1、畸變校正 — 一種去除圖像上透鏡的徑向和切向畸變的數(shù)學(xué)方法,以獲得未失真的圖像。

2、在校正過程中調(diào)整相機(jī)之間的角度和距離。結(jié)果是直線對齊和細(xì)化圖像,即同一平面的兩幅圖像共面,其直線對齊方向相同,具有相同的y坐標(biāo)。

272a7b8a-1f81-11ed-ba43-dac502259ad0.png

3、點(diǎn)匹配過程 — 搜索左、右攝像頭點(diǎn)之間的對應(yīng)關(guān)系。在那之后,你會得到有一個視差圖 —— 其中的值對應(yīng)于左右攝像機(jī)同一點(diǎn)的圖像x坐標(biāo)的差異。

4、因此,有了相機(jī)的幾何排列,我們產(chǎn)生了視差圖的三角度量。這是重投影階段,形成深度圖,也就是想要的3D場景。

對于前兩個階段,你必須首先計(jì)算這一對相機(jī)的配置參數(shù)。這可以通過各種二值化的標(biāo)定板自動完成,比如ArUco或ChArUco。這些標(biāo)定板的主要優(yōu)點(diǎn)是,即使是單個標(biāo)定板也能提供足夠的一致性來獲得相機(jī)的姿勢。此外,內(nèi)部的二進(jìn)制編碼使它們特別可靠,因?yàn)樗梢赃M(jìn)行錯誤檢測和糾正。你也可以使用標(biāo)定板來確定相機(jī)下區(qū)域的幾何形狀。

2750bd4a-1f81-11ed-ba43-dac502259ad0.png

體積度量

為了度量體積,你還需要進(jìn)行下面的步驟:

1、對一組連續(xù)的幀進(jìn)行累積,這將增加錯誤恢復(fù)的彈性,用于對3D場景進(jìn)行平均或細(xì)化。

2、只在場景中選擇產(chǎn)品定義的點(diǎn)。這是通過使用顏色分割、模板匹配或神經(jīng)網(wǎng)絡(luò)語義分割來實(shí)現(xiàn)的。最快的方法是顏色分割。該方法的缺點(diǎn)是將設(shè)置綁定到特定的產(chǎn)品上,如果背景顏色和對象不是很清楚,可能會產(chǎn)生不好的結(jié)果。如果GPU優(yōu)化是可能的,那么使用U形卷積神經(jīng)網(wǎng)絡(luò)如U-net和高級U-net,或全卷積神經(jīng)網(wǎng)絡(luò)會有較高的性能和分割精度。

3、對一個由產(chǎn)品定義的3D點(diǎn)組成的場景進(jìn)行聚類。每個簇是一個對象。

275f8b72-1f81-11ed-ba43-dac502259ad0.png

277aa70e-1f81-11ed-ba43-dac502259ad0.png

4、為每個簇形成一個凸多邊形,消除3d場景對象的邊緣缺陷

5、使用線性插值恢復(fù)缺失的3D點(diǎn)

6、通過基于場景的幾何聚類區(qū)域積分來計(jì)算單個對象的體積。

279210ec-1f81-11ed-ba43-dac502259ad0.png

7、最后,計(jì)算所有物體的總體積。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 立體視覺
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    9944
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46781
  • 自動駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14321

    瀏覽量

    170674

原文標(biāo)題:計(jì)算機(jī)視覺中的雙目立體視覺和體積度量

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    雙目視覺在智能駕駛領(lǐng)域的應(yīng)用

    圍繞“雙目智駕應(yīng)用”,我們將推出系列文章深入解析雙目視覺如何跨越技術(shù)鴻溝,在中國智駕的沃土上生根發(fā)芽,探索其賦能未來出行的無限可能。
    的頭像 發(fā)表于 07-09 16:21 ?230次閱讀

    智能軟件+硬件解決方案克服實(shí)時立體視覺的挑戰(zhàn)

    立體視覺是一種強(qiáng)大的成像技術(shù),通過使用兩臺或多臺相機(jī)以略微不同的角度拍攝,模擬人類通過雙眼感知深度的方式,從而捕捉環(huán)境的三維結(jié)構(gòu)。這項(xiàng)技術(shù)能夠提供全視野的高密度三維測量,并在非結(jié)構(gòu)化和動態(tài)環(huán)境中表
    的頭像 發(fā)表于 05-16 17:04 ?214次閱讀
    智能軟件+硬件解決方案克服實(shí)時<b class='flag-5'>立體視覺</b><b class='flag-5'>中</b>的挑戰(zhàn)

    中科慧眼三目立體視覺產(chǎn)品的功能優(yōu)勢

    2025年上海國際車展已正式開幕,三目立體視覺產(chǎn)品作為推動智駕平權(quán)的關(guān)鍵力量,也在全民智駕時代備受矚目。
    的頭像 發(fā)表于 05-06 09:23 ?472次閱讀

    中科慧眼三目立體視覺相機(jī)將亮相2025上海車展

    2025年上海國際車展開幕在即,這場全球矚目的行業(yè)盛會不僅是車企競技的舞臺,更是前沿技術(shù)趨勢的風(fēng)向標(biāo)。隨著智能駕駛加速邁向“全民普惠”時代,三目立體視覺技術(shù)正以其低成本、高精度、強(qiáng)適配性的優(yōu)勢,成為推動智駕平權(quán)的關(guān)鍵力量。
    的頭像 發(fā)表于 04-19 10:36 ?590次閱讀

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計(jì)算機(jī)視覺的支持

    計(jì)算機(jī)視覺的支持,擴(kuò)大了當(dāng)前對音頻、雷達(dá)和其他時間序列信號數(shù)據(jù)的支持范圍。在增加這項(xiàng)支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用領(lǐng)域的機(jī)器學(xué)習(xí)開發(fā)人員帶來極大的便利,例如工廠可以借此實(shí)現(xiàn)對零件的
    的頭像 發(fā)表于 03-11 15:11 ?389次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的支持

    Arm KleidiCV與OpenCV集成助力移動端計(jì)算機(jī)視覺性能優(yōu)化

    等多種應(yīng)用。然而,這些計(jì)算機(jī)視覺應(yīng)用可能很難實(shí)現(xiàn)最優(yōu)化的延遲性能和處理速度,特別是在內(nèi)存大小、電池容量和處理能力有限的移動設(shè)備上難度更高。 而 Arm KleidiCV 便能在其中大顯身手。該開源庫利用了最新 Arm CPU
    的頭像 發(fā)表于 02-24 10:15 ?566次閱讀

    AR和VR計(jì)算機(jī)視覺

    ):計(jì)算機(jī)視覺引領(lǐng)混合現(xiàn)實(shí)體驗(yàn)增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1573次閱讀
    AR和VR<b class='flag-5'>中</b>的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>

    【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計(jì)算機(jī)視覺?計(jì)算機(jī)視覺,其實(shí)就是教機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說,它能認(rèn)出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1245次閱讀
    【小白入門必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線

    ARMxy嵌入式計(jì)算機(jī)在機(jī)器視覺的卓越表現(xiàn)

    嵌入式視覺是指在嵌入式系統(tǒng)中使用計(jì)算機(jī)視覺技術(shù),與經(jīng)常所說的機(jī)器視覺系統(tǒng)的區(qū)別在于嵌入式視覺系統(tǒng)是多合一的設(shè)備,簡單來說嵌入式
    的頭像 發(fā)表于 10-10 14:47 ?549次閱讀
    ARMxy嵌入式<b class='flag-5'>計(jì)算機(jī)</b>在機(jī)器<b class='flag-5'>視覺</b><b class='flag-5'>中</b>的卓越表現(xiàn)

    立體視覺新手必看:英特爾? 實(shí)感? D421深度相機(jī)模組

    入門級立體深度模組,旨在以高性價比將先進(jìn)的深度感應(yīng)技術(shù)帶給更廣泛的用戶群體,為尋求深度成像技術(shù)及消費(fèi)產(chǎn)品潛力的開發(fā)者、研究人員和計(jì)算機(jī)視覺專家提供卓越的價值,將先進(jìn)的3D視覺技術(shù)拓展至
    的頭像 發(fā)表于 09-26 13:33 ?583次閱讀
    <b class='flag-5'>立體視覺</b>新手必看:英特爾? 實(shí)感? D421深度相機(jī)模組

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?2050次閱讀

    圖像處理器與計(jì)算機(jī)視覺有什么關(guān)系和區(qū)別

    圖像處理器與計(jì)算機(jī)視覺是兩個在圖像處理領(lǐng)域緊密相連但又有所區(qū)別的概念。它們之間的關(guān)系和區(qū)別可以從多個維度進(jìn)行探討。
    的頭像 發(fā)表于 08-14 09:36 ?1048次閱讀

    計(jì)算機(jī)視覺的圖像融合

    在許多計(jì)算機(jī)視覺應(yīng)用(例如機(jī)器人運(yùn)動和醫(yī)學(xué)成像),需要將多個圖像的相關(guān)信息整合到單一圖像。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場
    的頭像 發(fā)表于 08-01 08:28 ?1143次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b><b class='flag-5'>中</b>的圖像融合

    地平線科研論文入選國際計(jì)算機(jī)視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計(jì)算機(jī)視覺頂會ECCV 2024,自動駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1466次閱讀
    地平線科研論文入選國際<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    計(jì)算機(jī)視覺技術(shù)的AI算法模型

    計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)
    的頭像 發(fā)表于 07-24 12:46 ?1809次閱讀