數(shù)據(jù)對(duì)于地圖來說十分重要,沒有數(shù)據(jù),就沒有地圖服務(wù)。用戶在使用地圖服務(wù)時(shí),不太會(huì)想到數(shù)據(jù)就像冰山一樣,用戶可見只是最直接、最顯性的產(chǎn)品功能部分,而支撐顯性部分所需要的根基,往往更龐大。
地圖數(shù)據(jù)最先是從專業(yè)采集來的,采集工具就是車、自行車、飛機(jī)和衛(wèi)星影像等,近兩年有了利用智能硬件的眾包采集。采集之后,就是把數(shù)據(jù)更新的速度和精準(zhǔn)度都無限提升。因?yàn)榈孛嫔献兓炝耍脩粼絹碓揭蕾囉诘貓D應(yīng)用。所以數(shù)據(jù)更新的速度和數(shù)據(jù)的準(zhǔn)確度就是在乎用戶體驗(yàn)的地圖公司的第一要?jiǎng)?wù)了。而數(shù)據(jù)更新的第一步,就是交通標(biāo)志檢測(cè)。
本文將主要介紹機(jī)器學(xué)習(xí)技術(shù)在高德的地圖數(shù)據(jù)生產(chǎn)的具體應(yīng)用,這些技術(shù)方案和設(shè)計(jì)都已經(jīng)過驗(yàn)證,取得了不錯(cuò)的效果,并且為高德地圖數(shù)據(jù)的快速更新提供了基礎(chǔ)的技術(shù)保證。
2.“交通 標(biāo)志檢測(cè)”定義
交通標(biāo)志檢測(cè),特指在普通街景圖像上通過自動(dòng)化手段檢測(cè)出各種類型的交通標(biāo)志,如限速、禁止掉頭、人行橫道和電子眼等。這些檢測(cè)結(jié)果將作為生產(chǎn)數(shù)據(jù)交付給地圖數(shù)據(jù)制作流程,最終演變?yōu)榉?wù)于廣大用戶的地圖數(shù)據(jù)。
3.難點(diǎn)與挑戰(zhàn)
交通標(biāo)志檢測(cè)的主要難點(diǎn)有樣式繁雜,且在拍攝過程中受自然環(huán)境的影響較大。此外,為滿足數(shù)據(jù)更新的速度和數(shù)據(jù)準(zhǔn)確度的要求,對(duì)于算法的性能要求也格外嚴(yán)格。
3.1 樣本形態(tài)差異大
交通標(biāo)志的形態(tài)差異主要體現(xiàn)在:
類型繁多:國標(biāo)定義的交通標(biāo)志有幾百個(gè)類型;
形狀多樣:常見交通標(biāo)志的形狀有三角形、圓形、方形、菱形、八邊形等,還有地面標(biāo)線、電子眼、信號(hào)燈,以及限高桿、柵欄等物理設(shè)施;
顏色分布廣泛:常見的有黃色、紅色、藍(lán)色、綠色、黑色、白色等;
圖像內(nèi)尺寸差異大:從幾百像素(如方牌、人行橫道等)到十幾像素(如電子眼)不均勻分布;
圖1 常見道路交通標(biāo)志(標(biāo)牌類)
3.2 自然場(chǎng)景下變化多端
在自然場(chǎng)景下,交通標(biāo)志存在樹木或車輛遮擋、磨損等情況;天氣、季節(jié)等也會(huì)影響到圖像采集過程中,造成圖像模糊、顏色失真等。
圖2 自然場(chǎng)景下拍攝的交通標(biāo)志
一些外形與交通標(biāo)志相似的標(biāo)牌,如商戶的招牌、交通公益廣告牌等,對(duì)算法的準(zhǔn)確率造成極大的挑戰(zhàn)。
圖3 類似交通標(biāo)志的噪聲示例
3.3 性能要求
準(zhǔn)召率:我們的應(yīng)用場(chǎng)景中對(duì)于召回率和準(zhǔn)確率的要求極高,任何未召回都會(huì)導(dǎo)致數(shù)據(jù)更新的延遲,而錯(cuò)召回則會(huì)影響作業(yè)效率與作業(yè)周期,最終對(duì)數(shù)據(jù)的快速更新造成影響;
吞吐量:高德每天需要處理上億張圖片,這就要求我們的算法不僅效果要好,處理速度也必須夠快,以免造成數(shù)據(jù)積壓,影響地圖數(shù)據(jù)的更新時(shí)效;
擴(kuò)展性:交通標(biāo)志的類型不是一成不變的(國標(biāo)會(huì)存在調(diào)整,不同國家和地區(qū)之間各有特色),因此需要算法環(huán)節(jié)具有非常好的擴(kuò)展性,能夠快速適應(yīng)新增的各種交通標(biāo)志類型;
4.高德地圖中的交通標(biāo)志檢測(cè)方案
當(dāng)前學(xué)術(shù)界針對(duì)目標(biāo)檢測(cè)任務(wù)常用的深度學(xué)習(xí)模型一般都采用End2End的方式進(jìn)行訓(xùn)練,以得到全局最優(yōu)的檢測(cè)效果。這個(gè)方案在使用時(shí)非常簡(jiǎn)單,只需要標(biāo)注好“幾百類物體的樣本”,然后放到深度學(xué)習(xí)的框架里進(jìn)行迭代訓(xùn)練,就可以獲得最終模型,主要可以分為Two Stage(FasterRCNN[1])和One Stage(YOLO[2],SSD[3])兩大類。
但是在實(shí)際使用過程中,需要應(yīng)對(duì)如下問題:
樣本標(biāo)注成本高:所有訓(xùn)練樣本都需要進(jìn)行全類別標(biāo)注,當(dāng)有新增類別時(shí)需要將歷史訓(xùn)練樣本全量補(bǔ)標(biāo),成本極高;
無法單類迭代:由于交通標(biāo)志出現(xiàn)的頻率和重要性不等,業(yè)務(wù)上對(duì)于部分類型(如電子眼、限速牌等)的準(zhǔn)召率要求更高。但是End2End的模型必須針對(duì)所有類型全量迭代,無法優(yōu)化單一類型,導(dǎo)致算法迭代和測(cè)試成本極高;
模型訓(xùn)練難度大:我們需要處理的交通標(biāo)志有幾百類,且各自出現(xiàn)頻率差異很大,使用單一目標(biāo)檢測(cè)模型完成如此巨大的分類任務(wù),模型訓(xùn)練難度太大,收斂緩慢,召回率、準(zhǔn)確率上難以平衡;
結(jié)合通用目標(biāo)檢測(cè)技術(shù)的發(fā)展以及高德地圖對(duì)于交通標(biāo)志檢測(cè)的需要,我們最終選擇了Faster-RCNN作為基礎(chǔ)檢測(cè)框架,它的檢測(cè)效果更好(尤其是針對(duì)小目標(biāo)),獨(dú)立的RPN網(wǎng)路也可以滿足擴(kuò)展性要求。速度方面,我們也進(jìn)行了針對(duì)性的優(yōu)化調(diào)整。
在實(shí)際使用時(shí),我們將檢測(cè)框架分為目標(biāo)檢測(cè)與精細(xì)分類兩階段:
圖4 交通標(biāo)志檢測(cè)的目標(biāo)檢測(cè)和精細(xì)分類階段
4.1 目標(biāo)檢測(cè)階段
目標(biāo)檢測(cè)階段的目的是通過Faster-RCNN在圖片中檢測(cè)所有的交通標(biāo)志,并進(jìn)行粗分類,要求極高的召回率和執(zhí)行速度。在實(shí)際使用時(shí),我們采用了如下策略來提升算法能力:
效果方面:將檢測(cè)目標(biāo)根據(jù)外形特征分為N大類(如圓形、三角形、方形,以及高寬比異常的人行橫道等),再為每一類配置專屬的RPN網(wǎng)絡(luò),各個(gè)RPN根據(jù)對(duì)應(yīng)的尺寸特性設(shè)計(jì)Anchor的Ratio和Scale;不同RPN根據(jù)需要使用不同層的特征圖,設(shè)計(jì)更有針對(duì)性;
效果方面,針對(duì)各個(gè)類型樣本分布不均勻問題,使用多種樣本增強(qiáng)手段,并在訓(xùn)練過程中使用OHEM等方式進(jìn)一步調(diào)整樣本分布;
效果方面,還借鑒了IoU-Net、Soft-NMS等方案,進(jìn)一步提升檢測(cè)效果;
性能方面,各個(gè)大類之間共享基礎(chǔ)卷積層,保證檢測(cè)時(shí)間不會(huì)過分增長;
擴(kuò)展性方面,對(duì)于新增類型,理想情況下只需要新增一個(gè)RPN網(wǎng)絡(luò)單獨(dú)迭代,可以不對(duì)其他類型的效果造成任何影響(如下圖,RPN1和RPN2完全獨(dú)立);
圖5 多RPN設(shè)計(jì)示意圖
4.2 精細(xì)分類階段
精細(xì)分類階段的目的是對(duì)目標(biāo)檢測(cè)階段得到候選框進(jìn)行精細(xì)分類并濾除噪聲,保證極高的召回率和準(zhǔn)確率。在實(shí)際實(shí)現(xiàn)中,還使用以下策略來提升效果:
為每個(gè)大類配置獨(dú)立的精細(xì)分類網(wǎng)絡(luò),互相之間不干擾;各個(gè)大類的迭代完全獨(dú)立和并行,可以多人并行研發(fā),有效縮短研發(fā)周期;
針對(duì)各個(gè)大類的難易程度,選擇不同計(jì)算復(fù)雜度的網(wǎng)絡(luò)來完成精細(xì)分類和噪聲抑制,避免因?yàn)槟承╊愋蛷?fù)雜度過高產(chǎn)生效率瓶頸;
樣本方面,各個(gè)大類可以獨(dú)立收集樣本,可以針對(duì)特定類型進(jìn)行收集和標(biāo)注,訓(xùn)練和測(cè)試集合的構(gòu)建效率大幅提升;
如下圖,針對(duì)圓形標(biāo)牌,其差異比較明確,可以使用簡(jiǎn)單網(wǎng)絡(luò);針對(duì)方牌,需要根據(jù)文字布局和內(nèi)容來區(qū)分正負(fù)樣本,分類難度大,因此必須使用較深的網(wǎng)絡(luò):
圖6 精細(xì)分類模塊示意圖
由于同時(shí)使用了多個(gè)模型,上述方案會(huì)導(dǎo)致服務(wù)器的顯存占用顯著增加,對(duì)計(jì)算資源產(chǎn)生額外要求。針對(duì)該問題,我們針對(duì)深度學(xué)習(xí)框架進(jìn)行優(yōu)化,動(dòng)態(tài)分配并在各模型間共享臨時(shí)緩沖區(qū),并裁剪框架的反向傳播功能,最終使得顯存占用降低50%以上。
5.效果與收益
上述方案已經(jīng)正式上線,準(zhǔn)召率都達(dá)到了生產(chǎn)作業(yè)的要求,日均圖片吞吐量在千萬以上。以下是部分效果圖(不同框代表不同檢測(cè)結(jié)果):
圖7 交通標(biāo)志檢測(cè)效果圖
6.小結(jié)
交通標(biāo)志檢測(cè)技術(shù)已經(jīng)在高德地圖內(nèi)部得到應(yīng)用,有效提升了高德地圖的數(shù)據(jù)制作效率,達(dá)成地圖數(shù)據(jù)更新速度接近T+0(時(shí)間差為零)的目標(biāo)。
目前我們也在把機(jī)器學(xué)習(xí)技術(shù)用于數(shù)據(jù)的自動(dòng)化制作,進(jìn)一步減少現(xiàn)實(shí)世界和地圖數(shù)據(jù)之間的差異,做到“連接真實(shí)世界,讓出行更美好”。
-
圖像采集
+關(guān)注
關(guān)注
2文章
307瀏覽量
41632 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7254瀏覽量
91790 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134548
發(fā)布評(píng)論請(qǐng)先 登錄
高德地圖攜手華為推出長隧道車道級(jí)導(dǎo)航
鴻蒙地圖功能開發(fā)【1. 開發(fā)準(zhǔn)備】##地圖開發(fā)##
HarmonyOS實(shí)戰(zhàn):高德地圖定位功能完整流程詳解
高德發(fā)布智能眼鏡行業(yè)解決方案
高德地圖攜手雷鳥創(chuàng)新打造新一代AI+AR智能導(dǎo)航解決方案
高德地圖與Rokid達(dá)成合作
高德與華為簽署合作協(xié)議
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
國產(chǎn)地物光譜儀在“高光譜-機(jī)器學(xué)習(xí)”模型構(gòu)建中的表現(xiàn)

**【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**
高德地圖與長城汽車共建出行聯(lián)合創(chuàng)新LAB
長城汽車聯(lián)手高德地圖打造出行聯(lián)合創(chuàng)新LAB
從《自動(dòng)駕駛地圖數(shù)據(jù)規(guī)范》聊高精地圖在自動(dòng)駕駛中的重要性

評(píng)論