一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

誰才是真正的C位 讓AI告訴你

人工智能與大數(shù)據(jù)技術(shù) ? 來源:yxw ? 2019-06-20 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

C位是近年網(wǎng)絡(luò)上一個(gè)比較熱門的詞,最早來源于DOTA等游戲領(lǐng)域,是核心位置(Carry位)的簡稱,代表的是能夠在游戲前中期打錢發(fā)育并在游戲后期帶領(lǐng)隊(duì)伍力挽狂瀾的角色。現(xiàn)在C位一詞逐漸擴(kuò)大到了娛樂圈乃至我們的生活中,在社交、表演、比賽以及各種日常活動(dòng)場景中,只要當(dāng)某一個(gè)人在人群中處于中心位置,即最重要的人,大家便稱呼他是C位(Center位)。

在包含眾多人像的照片中,由于每個(gè)人的穿著和動(dòng)作各異,同時(shí)人與人之間存在各種交互信息,以及所處的場景不同,我們通過肉眼來確定C位的時(shí)候可能會(huì)出現(xiàn)各種偏差。在人工智能快速發(fā)展的今天,我們能否可以通過AI來自動(dòng)找出C位呢?答案當(dāng)然是肯定的。在這篇文章中,我們將介紹如何利用計(jì)算機(jī)視覺深度學(xué)習(xí)技術(shù)構(gòu)建一個(gè)性能優(yōu)異的C位檢測器,從而快速準(zhǔn)確地在一群人中發(fā)現(xiàn)真正站C位的那個(gè)最重要的人。

C位檢測器前傳

C位檢測器的目標(biāo)是檢測出一群人中最重要的人。一般來說,C位檢測器主要由兩部分組成,第一部分是人臉/全身檢測模型,通過該模型首先檢測出照片中的所有人像;第二部分是人像重要性預(yù)測模型,通過該模型對檢測出的每個(gè)人像計(jì)算重要性得分,重要性得分最高的人即為C位。

當(dāng)前的人臉/全身檢測模型的性能已經(jīng)比較理想,而人像重要性預(yù)測模型還處在研究和探索階段,所以下面我們的內(nèi)容將主要圍繞如何量化一群人中每個(gè)人的重要性展開。

最直接的人像重要性計(jì)算可以基于照片中人像所處的位置和面積進(jìn)行設(shè)計(jì),例如,離照片中心點(diǎn)越近則重要性越高,人像的面積越大則重要性越高等等。然而我們判斷一個(gè)人是不是C位,除了利用照片中人像所處的位置和面積這類人像自身的幾何信息外,還會(huì)根據(jù)照片上的各種信息綜合判斷:人像自身的外表信息(上圖(a))、與其他人之間的關(guān)系信息(上圖(b))以及所處的全局場景信息(上圖(c))。

人與人之間的關(guān)系和人與場景之間的關(guān)系對C位的判斷起到關(guān)鍵性作用。如果我們只利用人像的自身特征進(jìn)行重要性計(jì)算,例如上圖(a)中的紅框女性,我們其實(shí)無法知道她是否是照片中最重要的人。但我們通過她與周圍人之間和與整體場景之間的關(guān)系信息分析便可以得出她是C位的結(jié)論。

一個(gè)理想的人像重要性預(yù)測模型應(yīng)根據(jù)上面提到的各方面信息進(jìn)行聯(lián)合計(jì)算。如何提取照片上豐富的多元化信息?如何對人與人之間和人與場景之間的關(guān)系建模,從而獲取高層次的語義信息?如何最終根據(jù)照片上人像的多元化信息和高層次語義信息的特征進(jìn)行重要性評估?這些都是擺在我們面前的問題,需要我們?nèi)ヒ灰唤鉀Q。

一個(gè)出色的C位檢測器

為了解決上節(jié)末提出的三個(gè)問題,我們實(shí)驗(yàn)室的小伙伴們攻堅(jiān)克難,提出了一種全新而高效的人像重要性預(yù)測模型,構(gòu)建了一個(gè)出色的C位檢測器,相關(guān)工作發(fā)表在CVPR 2019。下面我們對其中的模型框架和建模思路進(jìn)行一一介紹,希望給大家?guī)砀嗟膯l(fā)和思考。

整個(gè)人像重要性預(yù)測模型分為三個(gè)模塊,分別是特征表達(dá)模塊、關(guān)系計(jì)算模塊和重要性分類模塊。特征表達(dá)模塊能夠有效地提取照片中每個(gè)人的自身特征和整張照片的全局場景特征。關(guān)系計(jì)算模塊能夠?qū)θ伺c人之間和人與場景之間的關(guān)系進(jìn)行建模。重要性分類模塊能夠計(jì)算每個(gè)人像的重要性得分,從而最終識(shí)別出最重要的C位人選。完整的模型框架如下圖所示。

特征表達(dá)模塊針對上節(jié)末“如何提取照片上豐富的多元化信息?”這一問題進(jìn)行設(shè)計(jì)。為了充分地獲取人像自身豐富的特征表達(dá),人像的外表信息和幾何信息都會(huì)進(jìn)行特征提取。深度卷積神經(jīng)網(wǎng)絡(luò)被用來實(shí)現(xiàn)提取流程,如下圖所示。其中,外表信息被分為內(nèi)在(綠框)和外在(藍(lán)框)兩部分,內(nèi)在區(qū)域更多提取人像固有的外表信息,外在區(qū)域更多用于提取人像外表以及與周圍環(huán)境的上下文信息,從而保證了人像信息的多元化。此外整張照片的全局場景信息(黃框)也會(huì)通過卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)特征提取。

關(guān)系計(jì)算模塊針對上節(jié)末“如何對人與人之間和人與場景之間的關(guān)系建模,從而獲取高層次的語義信息?”這一問題進(jìn)行設(shè)計(jì),是整個(gè)模型中最關(guān)鍵的模塊。在該模塊中,關(guān)系網(wǎng)絡(luò)(Relation Networks)被用來對在特征表達(dá)模塊中提取的人像特征和場景特征進(jìn)行關(guān)系建模。關(guān)系網(wǎng)絡(luò)能夠在沒有額外監(jiān)督信息的前提下,自動(dòng)學(xué)習(xí)人與人之間和人與場景之間的關(guān)系,從而提取更高層次的語義信息以表征人在場景中的重要性。具體會(huì)分別建立人與人之間的關(guān)系圖和人與場景之間的關(guān)系圖,通過多個(gè)并行的關(guān)系網(wǎng)絡(luò)提取關(guān)系特征并連接,再與原有的人像特征相加,得到最終的特征表達(dá)。

重要性分類模塊針對上節(jié)末“如何最終根據(jù)照片上人像的多元化信息以及高層次語義信息的特征進(jìn)行重要性評估?”這一問題進(jìn)行設(shè)計(jì)。通過對在關(guān)系計(jì)算模型中提取的每個(gè)人像的最終特征表達(dá)進(jìn)行重要/不重要的二分類,將每個(gè)人像被分為重要這個(gè)類別的概率作為重要性得分,得分最高的人像就是模型認(rèn)定的C位。

以上三個(gè)模塊一起實(shí)現(xiàn)了端到端的人像重要性訓(xùn)練和預(yù)測。最后我們來看一看利用上述模型進(jìn)行C位檢測的可視化結(jié)果。紅框代表的是模型檢測出來的C位,綠框代表的是當(dāng)前其他最好方法的檢測結(jié)果,可以看出在充分考慮了照片中人與人之間和人與場景之間的關(guān)系信息后,在各種復(fù)雜場景下,AI均能夠準(zhǔn)確地檢測出真正的C位。

C位檢測可以自動(dòng)快速地在人群中找出最重要的那個(gè)人。通過這篇文章,我們介紹了利用AI進(jìn)行C位檢測的一般流程和遇到的挑戰(zhàn),也進(jìn)一步分享了一種優(yōu)秀的C位檢測器的構(gòu)建思路與過程。其中的更多細(xì)節(jié)大家可以在arXiv上搜索《Learning to Learn Relation for Important People Detection in Still Images》進(jìn)行查看。最后祝大家都能在各自的領(lǐng)域內(nèi)不斷進(jìn)步,實(shí)現(xiàn)自我價(jià)值,站上屬于自己的C位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    163

    文章

    4597

    瀏覽量

    122914
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249581
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122799

原文標(biāo)題:誰才是真正的C位,讓AI告訴你

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    樂橙亮相2025廣州建博會(huì):用AI重新定義家庭安全與技術(shù)邊界

    在智能鎖邁入AI新時(shí)代的關(guān)鍵節(jié)點(diǎn),才是真正的技術(shù)引領(lǐng)者?2025年廣州建博會(huì),樂橙用一場“不炫技、重本質(zhì)”的深度展演給出了答案。智哪兒在現(xiàn)場了解到,在A區(qū)3.1-28展位,樂橙圍繞“
    的頭像 發(fā)表于 07-09 21:10 ?307次閱讀
    樂橙亮相2025廣州建博會(huì):用<b class='flag-5'>AI</b>重新定義家庭安全與技術(shù)邊界

    淘寶 vs 京東電商 API 接口,才是數(shù)據(jù)王者?

    API進(jìn)行客觀比較,幫助您判斷才是真正的“數(shù)據(jù)王者”。 1.API功能覆蓋范圍 API的功能范圍決定了開發(fā)者能獲取的數(shù)據(jù)類型。淘寶API通過阿里巴巴開放平臺(tái)提供,覆蓋商品、訂單、用戶、物流等多個(gè)模塊。例如,商品API支持搜索、
    的頭像 發(fā)表于 07-08 15:51 ?178次閱讀
    淘寶 vs 京東電商 API 接口,<b class='flag-5'>誰</b><b class='flag-5'>才是</b>數(shù)據(jù)王者?

    日常設(shè)備真正的距離感知Bluetooth? Channel Sounding

    日常設(shè)備真正的距離感知Bluetooth? Channel Sounding
    的頭像 發(fā)表于 06-19 16:38 ?465次閱讀
    <b class='flag-5'>讓</b>日常設(shè)備<b class='flag-5'>真正</b>的距離感知Bluetooth? Channel Sounding

    聲紋解鎖個(gè)性化!啟明云端硅思物語AI平臺(tái)設(shè)備“認(rèn)準(zhǔn)的聲音”

    的設(shè)備能“聽聲識(shí)人”嗎?>小明對著設(shè)備問:“猜猜我是?”>設(shè)備秒答:“是啟明云端的程序員小明!”>換人提問,設(shè)備立刻回應(yīng):“是小美,小明的女朋友!”——這不是科幻電影,而是
    的頭像 發(fā)表于 06-17 18:02 ?456次閱讀
    聲紋解鎖個(gè)性化!啟明云端硅思物語<b class='flag-5'>AI</b>平臺(tái)<b class='flag-5'>讓</b>設(shè)備“認(rèn)準(zhǔn)<b class='flag-5'>你</b>的聲音”

    神眸引領(lǐng)AI智能視覺新范式,科技更有溫度

    AI能力矩陣,更是通過情感化交互與場景化服務(wù),用戶真正感受到科技帶來的溫暖陪伴。神眸以“云、網(wǎng)、邊、端、芯”全鏈路自研架構(gòu)為基石,從芯片級(jí)性能突破到云端智能服
    的頭像 發(fā)表于 05-23 13:24 ?411次閱讀
    神眸引領(lǐng)<b class='flag-5'>AI</b>智能視覺新范式,<b class='flag-5'>讓</b>科技更有溫度

    聯(lián)想,AI計(jì)算發(fā)生“鐘擺革命”

    AI基礎(chǔ)設(shè)施革新,智能化越過山丘
    的頭像 發(fā)表于 05-15 19:12 ?1422次閱讀
    聯(lián)想,<b class='flag-5'>讓</b><b class='flag-5'>AI</b>計(jì)算發(fā)生“鐘擺革命”

    失去工作不是因?yàn)?b class='flag-5'>AI,而是因?yàn)槭褂?b class='flag-5'>AI的人

    當(dāng)算法能精準(zhǔn)預(yù)測消費(fèi)者需求時(shí),當(dāng)AI生成的文案比人類更懂傳播心理學(xué)時(shí),當(dāng)自動(dòng)化系統(tǒng)開始取代基礎(chǔ)決策崗位時(shí),真正的危機(jī)已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握
    的頭像 發(fā)表于 05-13 12:05 ?243次閱讀
    <b class='flag-5'>你</b>失去工作不是因?yàn)?b class='flag-5'>AI</b>,而是因?yàn)槭褂?b class='flag-5'>AI</b>的人

    最討厭AI的人選了特朗普

    魔幻的“川普美國”,只是果,選了特朗普,才是
    的頭像 發(fā)表于 04-22 16:42 ?754次閱讀
    最討厭<b class='flag-5'>AI</b>的人選了特朗普

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會(huì)上,聯(lián)發(fā)科定義了“智能體化用戶體驗(yàn)”的五大特征:主動(dòng)及時(shí)、知懂你、互動(dòng)協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個(gè)
    發(fā)表于 04-13 19:52

    利爾達(dá)AI豆系列C出道!快來Pick的智能新頂流

    //3月22日,由扣子Coze與火山引擎聯(lián)合主辦的“扣子AI工坊·硬件專場”在深圳、北京、杭州、成都四城圓滿落幕。利爾達(dá)作為Coze與火山引擎的重要合作伙伴受邀出席,不僅全面展示了最新推出的AI
    的頭像 發(fā)表于 03-28 16:43 ?575次閱讀
    利爾達(dá)<b class='flag-5'>AI</b>豆系列<b class='flag-5'>C</b><b class='flag-5'>位</b>出道!快來Pick<b class='flag-5'>你</b>的智能新頂流

    AnyDesk vs. Raspberry Pi Connect,才是“遠(yuǎn)程霸主”?

    在樹莓派的世界里,遠(yuǎn)程控制就像是一場魔法對決,而今天,我們的主角是兩遠(yuǎn)程控制界的“魔法師”——AnyDesk和RaspberryPiConnect。它們都聲稱自己是遠(yuǎn)程控制的最佳選擇,那么,才是
    的頭像 發(fā)表于 03-25 09:24 ?362次閱讀
    AnyDesk vs. Raspberry Pi Connect,<b class='flag-5'>誰</b><b class='flag-5'>才是</b>“遠(yuǎn)程霸主”?

    AI全能助手 三星Galaxy S25系列生活更高效便捷

    生成式AI技術(shù)為智能手機(jī)開啟全新的進(jìn)化路徑。如何更高效地管理行程,如何更快速地獲取信息,如何設(shè)備真正理解用戶的需求,成為廣大用戶對智能手機(jī)新的期待。三星Galaxy S25系列憑借全面升級(jí)
    的頭像 發(fā)表于 03-24 16:05 ?408次閱讀

    啟明智顯AI服務(wù)機(jī)器人解決方案:智能硬件方案的佼佼者

    啟明智顯AI服務(wù)機(jī)器人解決方案,以多模態(tài)感知+全棧AI能力,打造真正“會(huì)思考、能辦事”的服務(wù)伙伴,機(jī)器人在家用與商用場景中真正“活”起來!
    的頭像 發(fā)表于 03-11 17:15 ?736次閱讀
    啟明智顯<b class='flag-5'>AI</b>服務(wù)機(jī)器人解決方案:智能硬件方案的佼佼者

    【「AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)」閱讀體驗(yàn)】書籍介紹

    會(huì)追根溯源,有種“大徹大悟”的感覺。 這本書主要講大語言模型的內(nèi)容,教我們做一個(gè)AI Agent應(yīng)用出來,其實(shí)這個(gè)東西現(xiàn)在也叫智能體了,他跟我們平常使用大語言模型有個(gè)不同點(diǎn)在于他會(huì)專注某個(gè)領(lǐng)域
    發(fā)表于 03-05 20:40

    如何在STM32f4系列開發(fā)板上部署STM32Cube.AI,

    已下載STM32Cube.AI擴(kuò)展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經(jīng)過開發(fā)板處理器進(jìn)行AI模型處理識(shí)別過后,告訴我識(shí)別結(jié)果,顯示在TFL
    發(fā)表于 11-18 09:39