(文章來(lái)源:樂晴智庫(kù))
當(dāng)前人工智能理論和技術(shù)日益成熟,應(yīng)用范圍不斷擴(kuò)大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應(yīng)的商業(yè)模式也在持續(xù)演進(jìn)和多元化。據(jù)IDC統(tǒng)計(jì),2018年我國(guó)人工智能市場(chǎng)規(guī)模為161.9億元,預(yù)計(jì)到2022年市場(chǎng)規(guī)模將接近700億元,年復(fù)合增長(zhǎng)率超過(guò)50%。據(jù)中國(guó)人工智能學(xué)會(huì)和羅蘭貝格咨詢公司預(yù)測(cè),2025年市場(chǎng)規(guī)模將達(dá)到3萬(wàn)億美元。
以深度學(xué)習(xí)為代表的人工智能算法的出現(xiàn)極大推動(dòng)了視覺人工智能行業(yè)的發(fā)展。計(jì)算機(jī)視覺是人工智能行業(yè)的最大組成部分,與其他細(xì)分的比較來(lái)看,計(jì)算機(jī)視覺技術(shù)應(yīng)用的市場(chǎng)規(guī)模也遠(yuǎn)遠(yuǎn)大于其他細(xì)分。
計(jì)算機(jī)視覺人工智能主要應(yīng)用領(lǐng)域之一,起源于20世紀(jì)80年代的神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)使用光學(xué)系統(tǒng)和圖像處理工具等來(lái)模擬人的視覺能力捕捉和處理場(chǎng)景的三維信息,理解并通過(guò)指揮特定的裝置執(zhí)行決策。2015年以來(lái),全球科技界和產(chǎn)業(yè)界高度重視視覺人工智能研究和應(yīng)用,在核心技術(shù)和產(chǎn)業(yè)化應(yīng)用的研發(fā)投入持續(xù)倍增。計(jì)算機(jī)視覺能極大提升機(jī)器的圖像感知能力和認(rèn)知能力,因此應(yīng)用場(chǎng)景十分廣闊,商業(yè)化變現(xiàn)空間大。
根據(jù)前瞻產(chǎn)業(yè)研究院的統(tǒng)計(jì),國(guó)內(nèi)人工智能企業(yè)中,有高達(dá)42%的企業(yè)應(yīng)用計(jì)算機(jī)視覺相關(guān)技術(shù),其次是語(yǔ)音和自然語(yǔ)言處理,分別占比24%、19%,兩者之和才與計(jì)算機(jī)視覺占比相當(dāng)。在安防影像分析、泛金融身份認(rèn)證、手機(jī)和互聯(lián)網(wǎng)娛樂、批發(fā)零售商品識(shí)別、工業(yè)制造、廣告營(yíng)銷、自動(dòng)駕駛、醫(yī)療影像分析等領(lǐng)域都具有巨大應(yīng)用價(jià)值。
視覺人工智能行業(yè)的發(fā)展,離不開技術(shù)的驅(qū)動(dòng):一方面諸如GPU、FPGA、ASIC等一系列AI芯片的出現(xiàn)極大提升了芯片計(jì)算能力,突破了傳統(tǒng)CPU的算力瓶頸;另一方面以深學(xué)習(xí)為代表的AI算法的崛起,使得AI視覺的識(shí)別能力有了很大的提高。硬件算力的提升以及軟件算法的進(jìn)步都對(duì)視覺人工智能的發(fā)展起到了重要的推動(dòng)作用。
計(jì)算機(jī)視覺的工作流程包含四個(gè)模塊:檢測(cè)、分類、跟蹤與語(yǔ)義分割。具體為成像設(shè)備首先捕獲圖像,然后對(duì)每個(gè)圖像進(jìn)行預(yù)處理,提取特征后輸入到分類模型中。計(jì)算機(jī)視覺是采用圖像處理、模式識(shí)別、人工智能技術(shù)相結(jié)合的手段,著重于一幅或多幅圖像的計(jì)算機(jī)分析。
圖像可以由單個(gè)或者多個(gè)傳感器獲取,也可以是單個(gè)傳感器在不同時(shí)刻獲取的圖像序列。在消費(fèi)級(jí)領(lǐng)域,隨著數(shù)據(jù)量上漲、運(yùn)算力提升和深度學(xué)習(xí)算法的發(fā)展,計(jì)算機(jī)視覺技術(shù)越來(lái)越多地被應(yīng)用在各類消費(fèi)級(jí)應(yīng)用場(chǎng)景中,典型的如人臉識(shí)別服務(wù),具體包括人臉檢測(cè)、人臉關(guān)鍵特征點(diǎn)、人臉對(duì)比、人臉?biāo)阉?、人臉屬性、人臉聚類、人力活體檢測(cè)等。
計(jì)算機(jī)視覺實(shí)現(xiàn)了計(jì)算機(jī)“看得懂”,人臉識(shí)別、OCR和圖像結(jié)構(gòu)化是其主要應(yīng)用場(chǎng)景。計(jì)算機(jī)視覺是用計(jì)算機(jī)模擬人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量,并且對(duì)圖形進(jìn)行處理,即實(shí)現(xiàn)計(jì)算機(jī)“看得懂”。計(jì)算機(jī)視覺行業(yè)產(chǎn)業(yè)鏈由上游基礎(chǔ)層、中游技術(shù)層以及下游應(yīng)用層組成。
上游基礎(chǔ)層基礎(chǔ)層:主要包括CPU、GPU等芯片硬件,深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等算法,以及由真實(shí)數(shù)據(jù)和模擬數(shù)據(jù)共同構(gòu)成的數(shù)據(jù)集。核心芯片被Intel、Nvidia等傳統(tǒng)芯片廠商把控,新型芯片廠商尚未崛起,規(guī)模應(yīng)用有待時(shí)日;開源平臺(tái)以谷歌的Tensorflow、Facebook的Caffe等為主,其它企業(yè)的深度學(xué)習(xí)框架多為二次開發(fā)。
中游技術(shù)層主要包括視頻識(shí)別、圖片識(shí)別、模式匹配等嵌入式視覺軟件,以及一站式解決方案。算法,初創(chuàng)企業(yè)占優(yōu);云計(jì)算,幾乎被AWS、Google Cloud、Azure、阿里云等壟斷。下游應(yīng)用層:為計(jì)算機(jī)視覺的落地場(chǎng)景,包括智慧安防、智慧金融、手機(jī)應(yīng)用、無(wú)人駕駛等商業(yè)領(lǐng)域。垂直行業(yè)龍頭占據(jù)場(chǎng)景,技術(shù)層初創(chuàng)企業(yè)向上滲透。
按照中國(guó)信息通信研究院的統(tǒng)計(jì)結(jié)果,目前中國(guó)人工智能應(yīng)用市場(chǎng)主要由五個(gè)領(lǐng)域構(gòu)成,其中,由于近幾年中國(guó)互聯(lián)網(wǎng)娛樂、廣告?zhèn)鞑ズ凸舶踩曨l監(jiān)控市場(chǎng)的高速發(fā)展,計(jì)算機(jī)視覺市場(chǎng)規(guī)模以37%占比大幅領(lǐng)先。而在機(jī)器視覺領(lǐng)域的細(xì)分市場(chǎng)構(gòu)成中,安防行業(yè)又以67.9%占據(jù)大部分份額,這得益于中國(guó)公共安全視頻監(jiān)控建設(shè)的龐大市場(chǎng)。
人工智能行業(yè)是一個(gè)典型的技術(shù)驅(qū)動(dòng)型行業(yè),技術(shù)的核心在于算力、算法和數(shù)據(jù)三個(gè)方面。GPU及AI專用芯片的出現(xiàn)突破了傳統(tǒng)CPU的算力瓶頸,數(shù)據(jù)運(yùn)算速度和處理規(guī)模爆發(fā)性增長(zhǎng),從而為大數(shù)據(jù)的分析提供硬件上的支持。越來(lái)越多的應(yīng)用領(lǐng)域正持續(xù)積累著日趨豐富的大數(shù)據(jù),海量的圖像和視頻內(nèi)容為深度學(xué)習(xí)提供了有力的數(shù)據(jù)支撐。
視覺人工智能行業(yè)的快速發(fā)展一方面得益于現(xiàn)階段算力的大幅提升及算法的大幅改善(國(guó)內(nèi)算法甚至已經(jīng)達(dá)到國(guó)際水平),另一方面則受益于下游應(yīng)用市場(chǎng)的廣闊空間。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法能力的不斷增強(qiáng)促進(jìn)了視覺人工智能行業(yè)的高速發(fā)展。
(責(zé)任編輯:fqj)
-
人工智能
+關(guān)注
關(guān)注
1807文章
49035瀏覽量
249790 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1709瀏覽量
46791
發(fā)布評(píng)論請(qǐng)先 登錄
AI芯片:加速人工智能計(jì)算的專用硬件引擎
利用邊緣計(jì)算和工業(yè)計(jì)算機(jī)實(shí)現(xiàn)智能視頻分析

Arm KleidiCV與OpenCV集成助力移動(dòng)端計(jì)算機(jī)視覺性能優(yōu)化
人工智能推理及神經(jīng)處理的未來(lái)

開源項(xiàng)目 ! 利用邊緣計(jì)算打造便攜式視覺識(shí)別系統(tǒng)
人工智能發(fā)展需要新的芯片技術(shù)

評(píng)論