一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于事件相機的統(tǒng)一幀插值與自適應(yīng)去模糊框架(REFID)

浙大光電 ? 來源:浙大光電 ? 2025-03-14 11:48 ? 次閱讀

01

研究成果概述

在光照不足的環(huán)境下實現(xiàn)動態(tài)場景的清晰、高幀率視頻是經(jīng)典成像領(lǐng)域的難題。近日,浙江大學(xué)光電科學(xué)與工程學(xué)院汪凱巍、白劍教授團隊聯(lián)合蘇黎世聯(lián)邦理工等國外科研團隊,為行業(yè)提供了基于事件相機(一種仿生傳感器)的解決方案。團隊提出了一種基于事件相機的統(tǒng)一幀插值與自適應(yīng)去模糊框架(REFID)。該框架基于雙向遞歸網(wǎng)絡(luò),結(jié)合事件流和圖像信息,自適應(yīng)地融合來自不同時間點的信息,從而能夠在模糊的輸入幀情況下同步實現(xiàn)高質(zhì)量的插幀與模糊圖像還原。此外,研究團隊還發(fā)布了高分辨率事件-視頻數(shù)據(jù)集 HighREV,為事件相機低級視覺任務(wù)提供了新的測試基準。

相關(guān)研究成果以“A Unified Framework for Event-based Frame Interpolation with Ad-hoc Deblurring in the Wild”為題于發(fā)表于人工智能領(lǐng)域頂級期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 。

02

研究背景

發(fā)明歷史超過60年的數(shù)字圖像傳感器,本質(zhì)上是基于光子積分原理的:當我們打開快門時,每個像元上發(fā)生光電轉(zhuǎn)換將光子轉(zhuǎn)化為電子實現(xiàn)圖像信息記錄,每完成一輪累積就輸出一幅圖(幀)。然而,當在光線不足的環(huán)境中拍攝動態(tài)場景時,由于需要長時間打開快門累積足夠的光子會帶來“運動模糊”,同時也無法獲得高幀率視頻。

最近十年逐漸被行業(yè)關(guān)注的事件相機是一種類生物視覺傳感器,它的輸出不依賴光子累積,因而具有高時間分辨率(微秒級)和高動態(tài)范圍(超過140dB)的優(yōu)勢,能夠捕捉傳統(tǒng)幀相機無法記錄的快速運動信息。因此,將事件信息與傳統(tǒng)圖像傳感器融合,指導(dǎo)每一幀圖像去除運動模糊,同時通過幀與幀之間的事件信息進行插值,有望同步實現(xiàn)暗光下的高幀率和清晰成像。

03

研究亮點

1

提出統(tǒng)一的事件相機幀插值與去模糊框架(REFID),能夠同時對銳利的視頻和模糊的視頻進行插幀。如圖1所示

?采用雙向遞歸網(wǎng)絡(luò)(bidirectional recurrent network),充分利用時間維度信息,在插值過程中自適應(yīng)去模糊。

?設(shè)計了事件引導(dǎo)的自適應(yīng)通道注意力模塊(EGACA),動態(tài)調(diào)整事件流與圖像信息的融合權(quán)重,提升插值質(zhì)量。

25838ec4-0080-11f0-9310-92fbcf53809c.png

圖1. 統(tǒng)一的事件相機幀插值與去模糊框架, 同時實現(xiàn)對銳利的視頻和模糊的視頻進行還原和插幀

2

引入自監(jiān)督學(xué)習(xí)策略,提高模型泛化能力:

?通過事件生成模型和運動補償機制,構(gòu)建自監(jiān)督損失,提高模型在無監(jiān)督環(huán)境下的適應(yīng)性。

?在真實數(shù)據(jù)集(HighREV)上進行自監(jiān)督微調(diào),實現(xiàn)從合成數(shù)據(jù)到真實數(shù)據(jù)的無縫遷移。引入自監(jiān)督學(xué)習(xí)策略,提高模型泛化能力:

?通過事件生成模型和運動補償機制,構(gòu)建自監(jiān)督損失,提高模型在無監(jiān)督環(huán)境下的適應(yīng)性。

?在真實數(shù)據(jù)集(HighREV)上進行自監(jiān)督微調(diào),實現(xiàn)從合成數(shù)據(jù)到真實數(shù)據(jù)的無縫遷移。

25a1293e-0080-11f0-9310-92fbcf53809c.png

圖2:自監(jiān)督訓(xùn)練/微調(diào)框架

3

構(gòu)建高分辨率事件-顏色視頻數(shù)據(jù)集(HighREV):

?采用1632×1224分辨率的事件相機采集數(shù)據(jù),涵蓋室內(nèi)外場景,提供高質(zhì)量事件流與RGB視頻對齊數(shù)據(jù)。

?該數(shù)據(jù)集填補了現(xiàn)有事件相機數(shù)據(jù)集中高分辨率和彩色數(shù)據(jù)的空缺,為事件相機的低級視覺任務(wù)提供新的測試基準。

實驗驗證:

?在標準基準數(shù)據(jù)集(GoPro、HighREV)上,REFID在清晰幀插值、模糊幀插值、單幀去模糊任務(wù)上均超越了當前最先進的方法。

?在自監(jiān)督微調(diào)場景下,REFID在真實世界數(shù)據(jù)集上的性能顯著提升,證明了其魯棒性和泛化能力。

25c113d4-0080-11f0-9310-92fbcf53809c.gif

圖3: 模糊視頻插幀和銳利視頻插幀結(jié)果(經(jīng)過了慢放處理)。左側(cè)視頻展示暗光下的原始視頻,可以看到運動帶來的模糊和由于低幀率帶來的不連續(xù);中間視頻為對標算法的效果;右側(cè)視頻為本文提出的新方法的效果,實現(xiàn)了高幀率清晰成像

04

總結(jié)與展望

人工智能在應(yīng)用端的落地需要為智能終端提供穩(wěn)定可靠的視覺信息,事件相機作為一種仿生傳感器可以提供高時間分辨率的視覺信息,有望補充傳統(tǒng)傳感器在面對復(fù)雜場景下的不足。本研究提出的算法框架結(jié)合了兩者的優(yōu)勢,突破了傳統(tǒng)算法在運動模糊場景下的局限,首次在同一框架內(nèi)同時實現(xiàn)高幀率清晰成像。該方法有望在瞬態(tài)信息捕捉、慢動作視頻生成、視頻編輯、增強現(xiàn)實(AR)、智能駕駛等領(lǐng)域發(fā)揮重要作用。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 仿生傳感器
    +關(guān)注

    關(guān)注

    1

    文章

    10

    瀏覽量

    2901

原文標題:前沿進展|汪凱巍團隊在IEEE TPAMI發(fā)文報道基于事件相機的高時間分辨清晰成像研究

文章出處:【微信號:zjuopt,微信公眾號:浙大光電】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    永磁同步電機自適應(yīng)高階滑模Type-2模糊控制

    針對永磁同步電機數(shù)學(xué)模型不確定問題,提出自適應(yīng)高階滑模Type-2模糊控制方法。采用積分滑模面二階滑??刂坡?,保持傳統(tǒng)滑??刂频聂敯粜圆崿F(xiàn)不含不確定高階輸入輸出有限時間穩(wěn)定;不需要預(yù)先確定干擾
    發(fā)表于 03-27 11:54

    GLAD應(yīng)用:大氣像差與自適應(yīng)光學(xué)

    ^-1^ 。 自適應(yīng)模型中,假設(shè)所有的驅(qū)動器都是樣的并且均勻分布在個正方形的口徑中,用戶可以自定義驅(qū)動器影響函數(shù)的空間寬度。對于空間波長大于用戶自定義空間寬度的成分,自適應(yīng)默認完
    發(fā)表于 03-10 08:55

    求助,關(guān)于利用DLPC3438投影與相機進行同步的疑問求解

    在使用DLPC3438光機進行投影時,在場同步信號發(fā)出的同時,發(fā)送相機的觸發(fā)信號,使相機同步采圖,設(shè)置相機的曝光時間為光機投影一幀的時間。這樣理論上可以使得
    發(fā)表于 02-26 08:34

    使用自己做的PCB板卡,發(fā)現(xiàn)DLP9500第一幀圖像故障,怎么解決?

    使用自己做的PCB板卡,發(fā)現(xiàn)DLP9500第一幀圖像故障(顯示不完全),于是把相同的代碼放到DLP410EVM官方評估板上,發(fā)現(xiàn)也會偶爾顯示不完全。FPGA工程的邏輯是,上電之后等待電源軌正常,512*5ns,之后開始顯示動作,我現(xiàn)在應(yīng)該從哪里排查?
    發(fā)表于 02-19 07:11

    基于自適應(yīng)優(yōu)化的高速交叉矩陣設(shè)計

    提出了種基于自適應(yīng)優(yōu)化的交叉矩陣傳輸設(shè)計,采用AHB協(xié)議并引入自適應(yīng)突發(fā)傳輸調(diào)整和自適應(yīng)優(yōu)先級調(diào)整的創(chuàng)新機制。通過動態(tài)調(diào)整突發(fā)傳輸?shù)拈L度和優(yōu)先級分配,實現(xiàn)了對數(shù)據(jù)流的有效管理,提升了
    的頭像 發(fā)表于 01-18 10:24 ?307次閱讀

    Teledyne Lecroy示波器算法

    示波器是通過內(nèi)部硬件ADC對模擬信號采樣來獲取離散的數(shù)據(jù)點,然而這些離散的數(shù)據(jù)點有時難以完整呈現(xiàn)出原始模擬信號的全貌。軟件算法的意義就在于,它能夠依據(jù)特定的數(shù)學(xué)算法,在已采集的數(shù)據(jù)點之間插入新的數(shù)據(jù)點,幫助使用者更好地還原和分析模擬信號的波形。最普遍的
    的頭像 發(fā)表于 12-24 16:11 ?957次閱讀

    UHF RFID自適應(yīng)射頻干擾對消技術(shù)

    。針對目前有源干擾對消技術(shù)存在的抑制效果和實時性較差的缺點在分析有源干擾對消原理的基礎(chǔ)上提出了基于改進Powell 搜索算法的自適應(yīng)射頻干擾對消方案。設(shè)計了有源對消電路通過改進的Powell 最優(yōu)搜索算法實現(xiàn)電路控制參數(shù)的自適應(yīng)
    發(fā)表于 11-05 10:22 ?1次下載

    步進電機如何自適應(yīng)控制?步進電機如何細分驅(qū)動控制?

    步進電機是種將電脈沖信號轉(zhuǎn)換為角位移或線位移的電機,廣泛應(yīng)用于各種自動化控制系統(tǒng)中。為了提高步進電機的性能,自適應(yīng)控制和細分驅(qū)動控制是兩種重要的技術(shù)手段。 、步進電機的自適應(yīng)控制
    的頭像 發(fā)表于 10-23 10:04 ?1322次閱讀

    如何在自己的固件中增加wifi自適應(yīng)性相關(guān)功能,以通過wifi自適應(yīng)認證測試?

    目前官方提供了自適應(yīng)測試固件 ESP_Adaptivity_v2.0_26M_20160322.bin 用于進行 wifi 自適應(yīng)認證測試. 請問如何在自己的固件中增加 wifi 自適應(yīng)性相關(guān)功能,以通過 wifi
    發(fā)表于 07-12 08:29

    ESP32C6作為UDP Server,使用recvfrom無法及時收到第一幀報文的原因?如何解決?

    后調(diào)用recvfrom()阻塞等待接收報文。 在測試時發(fā)現(xiàn),AP在接收來自STA的第一幀UDP報文時recvfrom()無法及時返回結(jié)果,通常在STA發(fā)送第一幀報文幾百毫秒之后,recvfrom
    發(fā)表于 06-06 07:34

    鴻蒙OS開發(fā):【次開發(fā),多端部署】(自適應(yīng)布局)

    針對常見的開發(fā)場景,方舟開發(fā)框架提煉了七種自適應(yīng)布局能力,這些布局可以獨立使用,也可多種布局疊加使用。
    的頭像 發(fā)表于 05-25 16:36 ?1982次閱讀
    鴻蒙OS開發(fā):【<b class='flag-5'>一</b>次開發(fā),多端部署】(<b class='flag-5'>自適應(yīng)</b>布局)

    鴻蒙OS開發(fā):【次開發(fā),多端部署】應(yīng)用(自適應(yīng)布局)

    針對常見的開發(fā)場景,方舟開發(fā)框架提煉了七種自適應(yīng)布局能力,這些布局可以獨立使用,也可多種布局疊加使用。
    的頭像 發(fā)表于 05-24 10:34 ?1336次閱讀
    鴻蒙OS開發(fā):【<b class='flag-5'>一</b>次開發(fā),多端部署】應(yīng)用(<b class='flag-5'>自適應(yīng)</b>布局)

    西安電子科技大學(xué)何剛團隊在IJCAI 2024發(fā)布視頻人臉恢復(fù)研究新成果

     人臉恢復(fù)是項通過提升圖像質(zhì)量來使面部特征更加清晰的技術(shù),主要包括去模糊、去噪、恢復(fù)等步驟。而視頻人臉恢復(fù)則是將此技術(shù)應(yīng)用到視頻序列中,除了要處理每一幀的圖像質(zhì)量外
    的頭像 發(fā)表于 05-24 10:17 ?790次閱讀

    stm32h7 dcmi不進入行中斷,且同一幀里面收到的所有字節(jié)的相同,為什么?

    stm32h7 dcmi 不進入行中斷,且同一幀里面收到的所有字節(jié)的相同,感覺好像在行消隱區(qū)接受的數(shù)據(jù)
    發(fā)表于 05-21 06:13

    如何判斷USART接收到一幀數(shù)據(jù)?

    如何判斷USART接收到一幀數(shù)據(jù)
    發(fā)表于 05-16 07:31