一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

騰訊優(yōu)圖吳永堅:計算機視覺在產(chǎn)業(yè)中的應用實踐和前沿思考

電子工程師 ? 來源:lq ? 2019-01-02 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對騰訊優(yōu)圖的發(fā)展歷程,吳永堅表示,優(yōu)圖是非常幸運的,幸運的同時也知道優(yōu)圖選對了方向,只要堅持,還是會有收獲的。

12 月 15 日,以"新趨勢、新技術、新應用"為主題的首屆騰訊云+社區(qū)開發(fā)者大會上,騰訊優(yōu)圖實驗室總監(jiān)吳永堅分享了《計算機視覺在產(chǎn)業(yè)中的應用實踐和前沿思考》。目前,騰訊優(yōu)圖在計算機視覺技術方面的產(chǎn)業(yè)研究和應用,涵蓋了零售、安防、金融等領域的實際應用案例和經(jīng)驗。

以下為演講整理,文章略有刪減:

什么是計算機視覺?計算機視覺到底是一個什么樣的問題?簡言之,計算機視覺是一門研究如何讓機器“看”的學問,涉及的重要一點是圖像理解的技術。

大家也許會問為什么計算機視覺在近五年來發(fā)展特別快,同時也誕生了很多的創(chuàng)業(yè)公司?就本質來講,計算機視覺能夠將線上線下的東西關聯(lián),關聯(lián)人、關聯(lián)物,這是它能發(fā)展起來的一個重要原因。

簡單介紹下,騰訊優(yōu)圖是騰訊旗下的一個頂尖 AI 實驗室,主要專注于人臉、人體、交通、醫(yī)療、影像、自動駕駛等有關計算機視覺領域的前沿研究和落地應用,曾有過多次刷新的實驗記錄。

有幾個數(shù)字需要了解:騰訊優(yōu)圖實驗室可提供 12 個行業(yè)解決方案,接入超過 70 多個騰訊明星產(chǎn)業(yè)的產(chǎn)品,擁有超過 700 多個全球專利。

作為一個技術人員來說,我覺得這一組數(shù)據(jù)都是非常值得驕傲的。同時,實驗室每年都會刷新一些新的世界紀錄,在今年 10 月,騰訊優(yōu)圖推出了DSFD 人臉檢測算法,在兩個關于人臉檢測的權威數(shù)據(jù)庫 WIDERFACE 和 FDDB 上再次刷新世界紀錄。

通過展示騰訊優(yōu)圖相關技術棧,可以看到騰訊優(yōu)圖聚焦計算機視覺,輸出整體技術能力,希望覆蓋到包括社交娛樂、安防、零售在內的各行各業(yè)。

嘗試——從QQ空間到“天天P圖”

在騰訊內部,我們最先落地的是社交娛樂,這也是我們這幾年來一直去做的事情。優(yōu)圖團隊在 2012 年成立,當時正處于 PC 互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代,我們需要不斷將技術輸入到 PC 端的相關應用中。而人臉技術在當時對騰訊甚至整個行業(yè)都很新。那我們?yōu)槭裁催x擇這個行業(yè)?選擇人臉技術這個比較新的領域進行研究?

當時,我們發(fā)現(xiàn) QQ 空間上有很多用戶上傳的圖片素材,而很多用戶公開的圖片中有一半以上是和人的臉部信息相關的,比如自拍、合照等。我們認為這是下一個風口,需要提前布局。

雖然我們很早運用了人臉檢測的技術,在 QQ 空間或 PC 端進行嘗試,但怎么做都沒有產(chǎn)生很大的價值。我們對選擇的技術方向曾經(jīng)有過糾結,但我們想既然用戶上傳這么多圖片都有人臉,一定是我們沒研究透徹,不等于它沒有將來。

很幸運,我們等到了另一個移動端的爆款產(chǎn)品“天天P圖”。隨著 2015 年《武媚娘》電視劇火了起來,我們的技術如人臉美妝、人臉檢測有了用武之地??梢哉f我們是非常幸運的,幸運的同時也知道我們賭對了方向,只要堅持,還是會有亮點的。

“天天P圖”去年還做的一款變臉 H5 “我的軍裝照”,更成為現(xiàn)象級刷屏事件,訪問量超過 10 億次,作為創(chuàng)新方面的案例被人民日報重點收錄。

延伸——從消費場景到產(chǎn)業(yè)端

從消費互聯(lián)網(wǎng)到產(chǎn)業(yè)互聯(lián)網(wǎng),從基于消費場景的不斷積累到探索產(chǎn)業(yè)場景的應用和落地,這成為騰訊多年發(fā)展歷程里所經(jīng)歷的一個必然階段。騰訊優(yōu)圖也開始嘗試在產(chǎn)業(yè)互聯(lián)網(wǎng)領域的落地,我們首先瞄準的是安防行業(yè)。2017 年,騰訊優(yōu)圖推出了面向治安管理場景的優(yōu)圖天眼智能安防平臺,以及面向交通監(jiān)督場景的智能交通平臺。

以優(yōu)圖天眼智能安防平臺為例,它支持上億張人臉照的搜索,只要用戶上傳一張人臉照,就可以跟系統(tǒng)庫進行核對反饋,毫秒級別識別速度,比如說對失蹤老人和失蹤兒童問題有很大的社會價值。我們在今年首屆中國國際進口博覽會上,以及深圳市人臉核審統(tǒng)一認證平臺項目等等,得到了很多客戶的認可。

除了安防外,我們還在零售領域進行了嘗試。

這個賽道里最重要的一點就是如何連接好線上線下。如通過人臉檢測設備,計算機視覺技術就可以做一個線上線下很好的關聯(lián),所以視覺AI將零售自然而言地關聯(lián)了起來。

去年年底,我們跟騰訊云聯(lián)合推出了“騰訊優(yōu)Mall智慧零售系統(tǒng)”,可幫助企業(yè)用戶打造“知人知面更知心”的智慧門店,借助計算機視覺能力為不同的顧客進行定制化推薦等。目前我們已與百麗國際旗下的滔博運動建立合作,今年 5 月,我們還聯(lián)合微信支付為家樂福上海天山店提供了刷臉支付系統(tǒng)。

此外,我們還有在金融行業(yè)的嘗試。

在金融領域最主要的應用是人臉核身的解決方案,它有效提升了銀行、保險、證券等行業(yè)的核身效率。什么是核身技術?就是驗證線下這個人是否是與身份證呈現(xiàn)的是同一個人的技術。這種技術包括身份證 OCR 技術、活體檢測和人臉比對技術,綜合保障人臉核身的準確性與有效性。目前我們跟騰訊旗下的微眾銀行有了很好的落地合作。

深化——深度學習模型推斷與訓練研究

剛才說了很多案例,接下來我介紹下騰訊優(yōu)圖在深度學習這股技術浪潮中對計算機視覺的研究與思考。

首先來看看圖像在社交領域的探索。

視頻這一年非?;穑绾芜M行實時裝飾是一個非常大的技術挑戰(zhàn):

第一點,需要有很高的計算精度,因為將裝飾物投影到人臉上,看得到的人臉像素要非常穩(wěn),就是說從這一幀到下一幀,人臉位置盡量不能浮動,需要很高的精度;

第二點是計算的速度,因為它覆蓋了很多計算機型,需要一秒能夠處理100 幀以上;

對模型的大小要求也非常高,因為現(xiàn)在前端的很多處理是放在手機端的,其容量及安裝更新都有很大的限制,這就要求我們的大小只能控制在5 兆以內。

最后,就是需要特別廣的平臺支持,除了支持如蘋果等高端機型以外,我們還要支持其他中低端的機型,至少實現(xiàn)90% 以上的機型覆蓋。因為不同的機型計算芯片也不一樣,對CPUGPU 都要有很好的兼容。

我們的首要訴求是,在面對移動端上的實時計算時,對人臉配置需要實時、兼容性好的深度學習前向推斷框架。

同樣在安防和商超場景的模型里,對人臉識別模型的需求也非常大。

通過圖中展示的學術里程碑,從2012 年開始,深度學習的訓練模型層數(shù)在不斷加深,訓練的能力也越來越強。從最開始的AlexNet/VGGNet模型,到最近的DPN 結構,模型已經(jīng)達到了上千層,并且有了更復雜的網(wǎng)絡子模型。

從優(yōu)圖的角度來看,業(yè)務持續(xù)落地帶來更多的業(yè)務數(shù)據(jù),2014 年我們訓練的只有百萬級別的數(shù)據(jù),而現(xiàn)在已是10 億級別甚至更高,如果還是使用單機訓練的話需要超過半年時間。

在具體的場景里,如安防、娛樂、商超等,每個場景略有不同。如果對每個場景訓練獨立模型,周期太長,無法滿足業(yè)務快速迭代的需求;此外百萬級搜索參數(shù)規(guī)模已高達4GB,帶寬成為嚴重的通信瓶頸。

面對計算、帶寬瓶頸和大量定制化的訓練需求,這需要我們要有一個大規(guī)模集群化平臺統(tǒng)一訓練和解決。

總結來講,在傳統(tǒng)機器學習邁向深度學習的過程中,我們始終面臨模型訓練與模型推斷的挑戰(zhàn)。現(xiàn)有的深度學習開源框架,面對這兩方面的挑戰(zhàn),無法提供合適的解決方案。

實際上,我們內部研發(fā)了兩個系統(tǒng):

一個是高性能分布式訓練平臺RadpidFlow,可支持多機多卡訓練,提供完整的定點量化解決方案?!岸c量化”即意味著從原來的 32 位能夠降到 8 位甚至更低,只有 8 位的訓練模型才能更快的在前端跑起來,對帶寬能夠進行充分的利用。

另一個是跨平臺的框架RadpidNet,能夠針對不同的芯片異構設備進行深度定制和優(yōu)化,資源占用少,計算速度快。

值得一提的是,去年,騰訊優(yōu)圖推出了一款移動端開源神經(jīng)推斷網(wǎng)絡庫 NCNN(RadpidNet的前身)。目前它不僅在業(yè)界所有開源深度前向推斷框架中排名第一,而且已經(jīng)被很多公司所應用,在今年被邀請加入了 Facebook ONNX 社區(qū)。當然,在我們看來NCNN還是有很多不能滿足業(yè)務需求的,所以我們后來基于NCNN做了很多研發(fā)創(chuàng)新,形成了現(xiàn)在我們使用的RapidNet。

演進——性能不斷提升,功耗持續(xù)優(yōu)化

另外再說一下當前芯片的發(fā)展趨勢。

大家經(jīng)常會聽到 CPU、GPU、AI 芯片,它們到底是什么關系?我簡單總結一下芯片的發(fā)展趨勢。

就芯片本身來講,因面積有限,最開始 CPU 為保證通用處理性能會占用很多的控制單元,而這部分不是用來計算的,算力比較弱;到了 GPU 時代,也就是 NVIDIA 發(fā)展起來的一個重要時期,它能夠把原來圖形處理的設計單元與深度學習進行適配,算力強,但功耗比較高;再往后的專用 AI 芯片,專用卷積加速模塊,為 AI 加速設計,包括很多的大公司或創(chuàng)業(yè)公司都在做這類的 AI 芯片。

通過騰訊優(yōu)圖過去幾年嘗試的真實場景中所積累的經(jīng)驗,可以發(fā)現(xiàn)兩個很明顯的發(fā)展趨勢:

首先是性價比會越來越高,同樣的價格,同一芯片所能提供的算力越來越強,這符合摩爾定律;但如果打通這些芯片橫向對比,我們還發(fā)現(xiàn)一個規(guī)律,單位功耗所買到的算力也越來越高,也就是說,單位算力輸出的情況下,功耗越來越低,這就引入了所謂“云+端”的概念。

這導致的另一個趨勢是,計算力開始從云向端上走。如從前段時間的英偉達的GPU到現(xiàn)在的英特爾Movidus芯片和國內的華為海思芯片都在進行這方面的嘗試,騰訊優(yōu)圖深度學習平臺的研究方向也從原來的 CPU、GPU 往 AI 芯片的方向上走。

在 11 月初的騰訊全球合作伙伴大會上,騰訊優(yōu)圖推出了一系列智能硬件產(chǎn)品,其中包括優(yōu)圖人臉識別一體機、優(yōu)圖盒子及騰訊優(yōu)圖 AI 攝影機。通過軟硬件協(xié)同,騰訊優(yōu)圖以更低成本、更佳性能和更優(yōu)體驗打造一體化的行業(yè)解決方案。

圖中展現(xiàn)了我們當前在商超里面部署的三款硬件產(chǎn)品,可以看到:優(yōu)圖人臉識別一體機,可實現(xiàn)便利店無人值守自助進店、員工考勤簽到等功能;優(yōu)圖盒子,通過攝像機進行前端人臉檢測與識別,解決的是存量的問題;騰訊優(yōu)圖 AI 攝影機,解決的則是增量的問題,既可進行人臉檢測,也可輸出區(qū)域熱力圖。這是比較完整的軟硬一體化的、“云+端”的商超場景下的解決方案。

目前,優(yōu)圖人臉識別一體機已經(jīng)率先在上海佘山世茂洲際深坑酒店落地,用戶只需“刷臉”就可完成會員注冊與綁定、酒店用餐、結賬免密支付等操作。

總結一下,騰訊優(yōu)圖以計算機視覺技術為核心,通過騰訊云以及騰訊 AI 開放平臺將自身的 AI 技術能力輸出給更多的開發(fā)者和企業(yè),從最底層的計算平臺,到中間的算法能力,再到安防、金融、零售、工業(yè)、教育等多個行業(yè)解決方案的能力輸出。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    9

    文章

    1709

    瀏覽量

    46781
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134635
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122799

原文標題:騰訊優(yōu)圖吳永堅:邁向深度學習,我們面臨模型訓練與推薦的雙重考驗

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AR和VR計算機視覺

    ):計算機視覺引領混合現(xiàn)實體驗增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1574次閱讀
    AR和VR<b class='flag-5'>中</b>的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>

    工業(yè)中使用哪種計算機?

    工業(yè)環(huán)境,工控機被廣泛使用。這些計算機的設計可承受極端溫度、灰塵和振動等惡劣條件。它們比標準消費類計算機更耐用、更可靠。工業(yè)計算機可控制
    的頭像 發(fā)表于 11-29 14:07 ?714次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉換
    的頭像 發(fā)表于 10-31 17:00 ?1246次閱讀
    【小白入門必看】一文讀懂深度學習<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及學習路線

    計算機控制系統(tǒng)實踐報告

    計算機控制技術實踐報告
    發(fā)表于 10-17 13:45 ?1次下載

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設備之間以及計算機各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設備和軟件程序。它在計算機系統(tǒng)
    的頭像 發(fā)表于 10-14 14:02 ?1322次閱讀

    ARMxy嵌入式計算機機器視覺的卓越表現(xiàn)

    嵌入式視覺是指在嵌入式系統(tǒng)中使用計算機視覺技術,與經(jīng)常所說的機器視覺系統(tǒng)的區(qū)別在于嵌入式視覺系統(tǒng)是多合一的設備,簡單來說嵌入式
    的頭像 發(fā)表于 10-10 14:47 ?549次閱讀
    ARMxy嵌入式<b class='flag-5'>計算機</b><b class='flag-5'>在</b>機器<b class='flag-5'>視覺</b><b class='flag-5'>中</b>的卓越表現(xiàn)

    信號繼電器計算機系統(tǒng)的應用

    信號繼電器計算機系統(tǒng)的應用是一個重要且復雜的領域,它作為電氣控制的關鍵元件,計算機系統(tǒng)中發(fā)揮著信號轉換、隔離、放大以及控制等多種作用。
    的頭像 發(fā)表于 09-27 16:29 ?942次閱讀

    計算機中總線的作用是什么

    計算機中,總線(Bus)扮演著極其重要的角色,它是計算機內部各功能部件之間傳送信息的公共通信干線。總線不僅連接了計算機的各個核心組件,還確保了數(shù)據(jù)、指令和控制信號的高效、準確傳輸。
    的頭像 發(fā)表于 08-26 15:57 ?3683次閱讀

    晶體管計算機和電子管計算機有什么區(qū)別

    晶體管計算機和電子管計算機作為計算機發(fā)展史上的兩個重要階段,它們多個方面存在顯著的區(qū)別。以下是對這兩類計算機
    的頭像 發(fā)表于 08-23 15:28 ?3622次閱讀

    存儲器微型計算機系統(tǒng)的作用

    存儲器微型計算機系統(tǒng)扮演著至關重要的角色,它是計算機存儲和處理數(shù)據(jù)的核心部件。以下將詳細介紹存儲器微型
    的頭像 發(fā)表于 08-22 14:25 ?4208次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻的信息。這一技術的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?2050次閱讀

    邊沿觸發(fā)器計算機中的應用

    邊沿觸發(fā)器計算機中的應用極為廣泛,它們作為數(shù)字電路的基本單元,對于實現(xiàn)計算機內部的時序控制、數(shù)據(jù)存儲與傳輸、以及復雜邏輯功能等方面起著至關重要的作用。以下將從邊沿觸發(fā)器的定義、特點
    的頭像 發(fā)表于 08-12 14:20 ?1293次閱讀

    計算機視覺的圖像融合

    許多計算機視覺應用(例如機器人運動和醫(yī)學成像),需要將多個圖像的相關信息整合到單一圖像。這種圖像融合可以提供更高的可靠性、準確性和數(shù)據(jù)
    的頭像 發(fā)表于 08-01 08:28 ?1143次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b><b class='flag-5'>中</b>的圖像融合

    DRAM計算機中的應用

    DRAM(Dynamic Random Access Memory,動態(tài)隨機存取存儲器)計算機系統(tǒng)扮演著至關重要的角色。它是一種半導體存儲器,用于存儲和快速訪問數(shù)據(jù),是計算機主內存
    的頭像 發(fā)表于 07-24 17:04 ?3015次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻的信息。為了實現(xiàn)這一目標,計算機
    的頭像 發(fā)表于 07-24 12:46 ?1816次閱讀