人,自行車,汽車或道路,天空,草地:圖像的哪些像素代表無人駕駛汽車前的不同前景人物或物體,哪些像素代表背景類別?這項稱為全景分割的任務是一個基本問題,已在許多領域中應用,例如自動駕駛汽車,機器人技術(shù),增強現(xiàn)實,甚至在生物醫(yī)學圖像分析中。在弗萊堡大學計算機科學系,Abhinav Valada博士是機器人學習的助理教授,也是BrainLinks-BrainTools的成員,他專注于這個研究問題。Valada和他的團隊開發(fā)了最先進的“ EfficientPS”人工智能(AI)模型,該模型可以更快,更有效地對視覺場景進行連貫識別。
這項任務通常使用稱為深度學習的機器學習技術(shù)來解決,其中人工神經(jīng)網(wǎng)絡弗賴堡研究人員解釋說,它們是從人腦中汲取靈感,從大量數(shù)據(jù)中學習。諸如Cityscapes之類的公共基準在衡量這些技術(shù)的進步方面起著重要作用。Valada團隊的成員Rohit Mohan說:“多年來,來自Google或Uber的研究團隊一直在這些基準測試中爭奪榜首。” 來自弗萊堡(Freiburg)的計算機科學家的方法已被開發(fā)出來,用于理解城市的城市場景,在“城市景觀”(Cityscapes)中排名第一,Cityscapes是最有影響力的自動駕駛場景理解研究的排行榜。EfficientPS還始終在其他標準基準數(shù)據(jù)集(例如KITTI,Mapillary Vistas和IDD)上設置新的最新技術(shù)。
在項目網(wǎng)站上,Valada展示了團隊如何在各種數(shù)據(jù)集上訓練不同AI模型的示例。結(jié)果疊加在相應的輸入圖像上,其中顏色顯示模型將像素分配給的對象類別。例如,汽車標記為藍色,人物標記為紅色,樹木標記為綠色,建筑物標記為灰色。此外,AI模型還在每個被視為獨立實體的對象周圍繪制邊框。弗萊堡大學的研究人員成功地訓練了該模型,以將所學的城市場景信息從斯圖加特轉(zhuǎn)移到紐約市。盡管AI模型不知道美國的城市長什么樣,但它能夠準確識別紐約市的場景。
Valada解釋說,以前解決該問題的大多數(shù)方法都具有較大的模型尺寸,并且在實際應用中(例如受資源嚴重限制的機器人技術(shù))在計算上非常昂貴,“我們的EfficientPS不僅可以實現(xiàn)最新的性能,而且這也是計算效率最高,最快的方法。這進一步擴展了可以使用EfficientPS的應用程序?!?/p>
-
神經(jīng)網(wǎng)絡
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103550 -
深度學習
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122783
發(fā)布評論請先 登錄
AI圖像識別攝像機

評論