一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌教你用"注意力"提升產(chǎn)品體驗

CVer ? 來源:新智元 ? 2023-06-27 14:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導讀】讓用戶在體驗過程中關注主要部分,得先抓住用戶的眼球。

人每時每刻都在接收海量的信息,例如每秒進入視網(wǎng)膜的數(shù)據(jù)量就達到了10的10次方比特,但人類會選擇性地關注一些任務相關或感興趣的區(qū)域以進一步處理,比如記憶、理解和采取行動等。

如何將人類的注意力進行建模,即顯著性模型(saliency model)在神經(jīng)科學、心理學、人機交互(HCI)和計算機視覺等領域開始得到廣泛關注。

預測「哪些區(qū)域可能吸引注意力」的能力在圖形、攝影、圖像壓縮和處理以及視覺質(zhì)量測量等領域具有許多重要應用。

不過,使用機器學習和基于智能手機的凝視估計來加速眼動研究需要專門的硬件,每臺成本高達三萬美元,并不具備廣泛推廣的條件。

最近,谷歌的研究人員介紹了兩篇相關領域的研究論文,分別發(fā)表在CVPR 2022和CVPR 2023上,主要研究了如何利用「人類注意力的預測模型」來實現(xiàn)更好的用戶體驗,例如用圖像編輯操作以最大限度地減少視覺混亂、分心或偽影等問題,使用圖像壓縮來更快地加載網(wǎng)頁或應用程序,并引導機器學習模型實現(xiàn)更直觀的類人解釋和模型性能。

這兩篇論文主要關注圖像編輯和圖像壓縮,并討論了在具體應用場景下,對注意力建模的相關最新進展。

注意力引導的圖像編輯

對人體注意力進行建模,通常需要把眼睛看到的圖像作為輸入,如自然圖像或網(wǎng)頁的屏幕截圖等,并將預測的熱力圖作為輸出。

預測得到的熱力圖會根據(jù)「眼球跟蹤器」或「鼠標懸停/點擊」等收集到的實時注意力近似值進行評估。

之前的模型大多利用手工制作的視覺線索特征,如顏色/亮度對比度、邊緣和形狀等,最近也有一些方法轉向基于深度神經(jīng)網(wǎng)絡來自動學習判別特征,使用的模型包括卷積、遞歸神經(jīng)網(wǎng)絡以及視覺Transformer網(wǎng)絡等。

谷歌在CVPR2022上發(fā)表的一篇論文中,利用深度顯著性模型(deep saliency models)進行視覺逼真的編輯(visually realistic edits),可以顯著改變觀察者對不同圖像區(qū)域的注意力。

c4709a24-14a8-11ee-962d-dac502259ad0.png

論文鏈接:https://openaccess.thecvf.com/content/CVPR2022/papers/Aberman_Deep_Saliency_Prior_for_Reducing_Visual_Distraction_CVPR_2022_paper.pdf

比如移除背景中分散注意力的物體可以降低照片中的雜亂程度,從而提高用戶滿意度;同樣,在視頻會議中,減少背景中的混亂度也可以增加對主要發(fā)言者的關注度。

為了探索哪些類型的編輯效果是可實現(xiàn)的,以及這些效果如何影響觀眾的注意力,研究人員開發(fā)了一個優(yōu)化框架,以用于使用可區(qū)分的預測顯著性模型來引導圖像中的視覺注意力。

c49b203c-14a8-11ee-962d-dac502259ad0.png

給定輸入圖像和表示干擾物區(qū)域的二元遮罩,使用顯著性預測模型對遮罩內(nèi)的像素提供指導并編輯圖像,降低遮罩區(qū)域內(nèi)的顯著性。

為了確保編輯后的圖像自然且逼真,研究人員精心選擇了四種圖像編輯操作符,其中包括兩個標準圖像編輯操作(即重新著色和圖像扭曲);以及及兩個可學習的操作符,即多層卷積濾波器和生成模型(GAN)。

利用這些操作符,該框架可以產(chǎn)生各種強大的效果,包括重新著色、修復、偽裝、對象編輯、插入以及面部屬性編輯,并且所有這些效果都是由單個預訓練的顯著性模型驅(qū)動的,沒有任何額外的監(jiān)督或訓練。

c4a70bf4-14a8-11ee-962d-dac502259ad0.png

減少視覺干擾的例子,由顯著性模型與幾個操作符引導,干擾物區(qū)域被標記在顯著性圖(紅色邊框)的頂部

需要注意的是,研究人員的目標不是與產(chǎn)生每種效果的專用方法競爭,只是演示如何通過嵌入在深度顯著性模型中的知識來指導多個編輯操作。

個性化的顯著性建模

之前的研究假定單個顯著性模型即可完成對全部人群的預測任務,不過人類的注意力在個體之間是不同的:雖然對顯著線索的檢測是一致的,但具體的順序、解釋和注視分布可以有很大的區(qū)別,這一問題也提供了為個人或團體創(chuàng)建個性化用戶體驗的機會。

在CVPR2023的一篇論文中,谷歌的研究人員引入了一個用戶感知的顯著性模型,也是首個僅用單模型就可以完成預測某個用戶、一組用戶和通用人群注意力的框架。

c4bc6b5c-14a8-11ee-962d-dac502259ad0.png

論文鏈接:https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_Learning_From_Unique_Perspectives_User-Aware_Saliency_Modeling_CVPR_2023_paper.pdf

該框架的核心是將每個參與者的視覺偏好與每個用戶的注意力熱力圖和自適應用戶遮罩進行組合,需要每個用戶的注意力標注在訓練過程中都是可用的,可用的數(shù)據(jù)集包括用于自然圖像的OSIE移動的凝視數(shù)據(jù)集、網(wǎng)頁的FiWI和WebSaliency數(shù)據(jù)集。

c4e4ee1a-14a8-11ee-962d-dac502259ad0.png

該模型并沒有預測表示所有用戶的注意力的單個顯著性熱力圖,而是預測每個用戶的注意力圖以編碼個體的注意力模式。

此外,該模型采用用戶掩碼(大小等于參與者數(shù)量的二進制向量)來指示當前樣本中參與者的存在,使得模型可以選擇一組參與者,并將偏好組合成單個熱力圖。

c517e1ee-14a8-11ee-962d-dac502259ad0.png

預測注意力與GT值,EML-Net是最先進模型的預測,對于兩個參與者/組具有相同的預測;Ours提出的用戶感知顯著性模型的預測,可以正確預測每個參與者/組的獨特偏好。第一個圖像來自OSIE圖像集,第二個圖像來自FiWI。

以顯著特征為中心的漸進式圖像解碼

除了圖像編輯,人類注意力模型也可以改善用戶的瀏覽體驗。

在上網(wǎng)時,最讓人感到不舒服的用戶體驗之一就是等待加載帶有圖像的網(wǎng)頁,特別是在網(wǎng)速很慢的情況下,一種改善用戶體驗的方式是圖像的漸進式解碼,可以隨著數(shù)據(jù)逐漸下載再解碼,并顯示越來越高分辨率的圖像,直到全分辨率圖像準備就緒。

漸進式解碼通常按順序進行(例如,從左到右、從上到下),使用預測注意力模型,就可以基于顯著性對圖像進行解碼,從而可以首先發(fā)送顯示最顯著區(qū)域的細節(jié)所需的數(shù)據(jù)。

例如,在肖像中,用于面部的字節(jié)可以優(yōu)先于用于失焦背景的字節(jié),因此用戶更早地感知到更好的圖像質(zhì)量,并體驗到顯著減少的等待時間。

基于這個想法,預測注意力模型可以幫助圖像壓縮和更快地加載具有圖像的網(wǎng)頁,改善大型圖像和流媒體/VR應用的渲染。

結論

上面兩篇論文展示了人類注意力的預測模型如何通過具體的應用場景實現(xiàn)令人愉快的用戶體驗,例如圖像編輯操作,可以減少用戶圖像或照片中的混亂、分心或偽影,以及漸進式圖像解碼,可以大大減少用戶在圖像完全渲染時的感知等待時間。

文中提出的用戶感知顯著性模型可以進一步為個人用戶或群體個性化上述應用程序,從而實現(xiàn)更豐富、更獨特的體驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108130
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4814

    瀏覽量

    103601
  • 圖像
    +關注

    關注

    2

    文章

    1094

    瀏覽量

    41254

原文標題:CVPR 2023 | 谷歌教你用"注意力"提升產(chǎn)品體驗

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    地熱發(fā)電環(huán)網(wǎng)柜局放監(jiān)測設備:清潔能源電網(wǎng)的"安全衛(wèi)士"

    文章由山東華科信息技術有限公司提供在"雙碳"目標驅(qū)動下,地熱發(fā)電作為穩(wěn)定基荷電源,其電網(wǎng)接入設備的可靠性至關重要。環(huán)網(wǎng)柜作為地熱電站與主網(wǎng)連接的關鍵節(jié)點,其內(nèi)部絕緣缺陷可能引發(fā)
    的頭像 發(fā)表于 07-16 10:15 ?87次閱讀
    地熱發(fā)電環(huán)網(wǎng)柜局放監(jiān)測設備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽為導航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    在導航技術領域,GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))和INS(慣性導航系統(tǒng))的結合,一直被業(yè)界譽為&quot;黃金搭檔&quot;。它們優(yōu)勢互補,克服了單一系統(tǒng)的局限性,為高精度、高可靠性的導航提供了完美
    的頭像 發(fā)表于 07-09 17:12 ?178次閱讀
    為什么GNSS/INS組合被譽為導航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    工業(yè)數(shù)采很多數(shù)據(jù)你可能用不上,不同系統(tǒng)要的&amp;quot;數(shù)據(jù)菜&amp;quot;要對號入座

    工業(yè)數(shù)采的本質(zhì),是給不同的系統(tǒng)&quot;投喂&quot;它們能消化的數(shù)據(jù)。就像請客吃飯,MES要的是&quot;快餐&quot;(快節(jié)奏數(shù)據(jù)),QMS要的是&
    的頭像 發(fā)表于 06-11 11:29 ?254次閱讀

    人形機器人為什么要定制? ——揭秘工業(yè)場景的&amp;quot;千面需求&amp;quot;

    核心洞察:標準化機器人難以破解工業(yè)場景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構+零代碼中樞&quot;?,為?人形機器人為什么要定制?提供了
    的頭像 發(fā)表于 06-10 17:19 ?306次閱讀
    人形機器人為什么要定制? ——揭秘工業(yè)場景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉儲界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉PROFINET網(wǎng)關實戰(zhàn)案例

    實戰(zhàn)案例,Ethercat轉PROFINET網(wǎng)關,倉儲界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?300次閱讀
    倉儲界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉PROFINET網(wǎng)關實戰(zhàn)案例

    中美貿(mào)易硬核破局!先積集成以中國&amp;amp;quot;芯&amp;amp;quot;智造筑牢供應鏈護城河

    加速鍵,&quot;當技術封鎖成為常態(tài),國產(chǎn)替代不再是備選,而是生存剛需。&quot;一全鏈國產(chǎn)鐵三角中國芯強勢崛起!我們以&quot;設計-制造-封測&quot;全鏈國產(chǎn)鐵三角,構建
    的頭像 發(fā)表于 04-27 10:49 ?290次閱讀
    中美貿(mào)易硬核破局!先積集成以中國&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;芯&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智造筑牢供應鏈護城河

    電纜局部放電在線監(jiān)測:守護電網(wǎng)安全的&amp;amp;quot;黑科技&amp;amp;quot;

    運行的命脈。而在這場與時間的賽跑中,電纜局部放電在線監(jiān)測技術正扮演著&quot;安全衛(wèi)士&quot;的角色,科技力量將隱患扼殺于萌芽狀態(tài)。一、看不見的&quot;定時炸彈&
    的頭像 發(fā)表于 04-14 18:12 ?322次閱讀
    電纜局部放電在線監(jiān)測:守護電網(wǎng)安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    智礦未來,&amp;amp;quot;晉&amp;amp;quot; 在眼前!邁威通信邀您共赴太原煤炭展科技盛宴

    第二十三屆太原煤炭(能源)工業(yè)技術與裝備展覽會將于2025年4月22~24日在山西瀟河國際會展中心隆重舉辦。&quot;太原煤炭(能源)技術裝備展覽會&quot;已成功舉辦了22屆,是山西最大、國內(nèi)外具有重要影響的煤炭能源裝備
    的頭像 發(fā)表于 04-10 16:26 ?415次閱讀
    智礦未來,&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;晉&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>; 在眼前!邁威通信邀您共赴太原煤炭展科技盛宴

    煉油廠開閉所局放監(jiān)測:為能源樞紐裝上&amp;amp;quot;智能安全閥&amp;amp;quot;

    文章由山東華科信息技術有限公司提供在煉油廠的能源樞紐——開閉所中,高壓設備如同&quot;電力心臟&quot;晝夜不息地運轉。這個布滿油氣管道的復雜環(huán)境里,局部放電現(xiàn)象如同潛伏的&quot;電火花
    的頭像 發(fā)表于 04-09 16:41 ?329次閱讀
    煉油廠開閉所局放監(jiān)測:為能源樞紐裝上&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智能安全閥&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監(jiān)測:為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽診器

    文章由山東華科信息技術有限公司提供在城市的地下脈絡中,隧道管廊承載著電網(wǎng)的&quot;主動脈&quot;,而變壓器堪稱其中的&quot;動力心臟&quot;。這個封閉而潮濕的環(huán)境中,變
    的頭像 發(fā)表于 04-09 16:37 ?338次閱讀
    隧道管廊變壓器局放在線監(jiān)測:為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上智能聽診器

    【硬核測評】凌華DAQE雙雄爭霸:工業(yè)數(shù)據(jù)采集界的&amp;amp;quot;速度與激情&amp;amp;quot;實戰(zhàn)解析

    在汽車碰撞測試的驚險瞬間,半導體晶圓的微觀世界,甚至是狂風呼嘯的風力發(fā)電場,一場關于數(shù)據(jù)采集的&quot;軍備競賽&quot;正在上演。凌華科技推出的DAQE-2010與DAQE-2010(G)這對&quot;黃金搭檔&
    的頭像 發(fā)表于 03-26 15:07 ?382次閱讀
    【硬核測評】凌華DAQE雙雄爭霸:工業(yè)數(shù)據(jù)采集界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速度與激情&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;實戰(zhàn)解析

    合微電子攜手中山古鎮(zhèn)政府開啟&amp;amp;quot;智光互聯(lián)&amp;amp;quot;新紀元 共筑全球智能照明產(chǎn)業(yè)高地

    2025年3月18日,在第32屆中國古鎮(zhèn)國際燈飾博覽會的聚光燈下,合微電子與中山市古鎮(zhèn)鎮(zhèn)政府簽署戰(zhàn)略合作協(xié)議,啟動&quot;智光互聯(lián)&quot;合作項目。作為國內(nèi)物聯(lián)網(wǎng)通信技術與芯片研發(fā)的領軍
    的頭像 發(fā)表于 03-19 09:47 ?613次閱讀
    <b class='flag-5'>力</b>合微電子攜手中山古鎮(zhèn)政府開啟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智光互聯(lián)&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;新紀元 共筑全球智能照明產(chǎn)業(yè)高地

    3分鐘讀懂 | 氣密性檢測儀如何&amp;amp;quot;揪出&amp;amp;quot;泄漏點?原理全拆解!

    在日常生活中,我們可能很少直接接觸到氣密性檢測儀,但在工業(yè)生產(chǎn)、汽車制造、醫(yī)療器械等領域,它卻是不可或缺的&quot;神器&quot;。那么,這個看似神秘的設備究竟是如何工作的?它又是如何精準
    的頭像 發(fā)表于 03-15 16:13 ?356次閱讀
    3分鐘讀懂 | 氣密性檢測儀如何&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;揪出&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;泄漏點?原理全拆解!

    創(chuàng)新驅(qū)動未來:大為錫膏為高精尖散熱器技術注入&amp;amp;quot;強芯&amp;amp;quot;動力

    在人工智能、區(qū)塊鏈、人形機器人、高性能計算等前沿技術飛速發(fā)展的今天,電子設備的&quot;體溫管理&quot;正成為決定技術突破的關鍵門檻。當算以指數(shù)級增長時,散熱器作為設備的&quot
    的頭像 發(fā)表于 02-13 10:41 ?400次閱讀
    創(chuàng)新驅(qū)動未來:大為錫膏為高精尖散熱器技術注入&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;強芯&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;動力

    OCTC發(fā)布&amp;quot;算工廠&amp;quot;!力促智算中心高效規(guī)劃建設投運

    創(chuàng)新提出面向未來數(shù)據(jù)中心的&quot;算工廠&quot;模式,核心是以規(guī)(劃)、建(設)、運(營)一體化的交鑰匙工程,實現(xiàn)智算中心快速投運、綠色低碳,在當前AIGC算供需挑戰(zhàn)下,開
    的頭像 發(fā)表于 10-11 09:10 ?864次閱讀
    OCTC發(fā)布&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;算<b class='flag-5'>力</b>工廠&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;!力促智算中心高效規(guī)劃建設投運