一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)字視頻穩(wěn)定調(diào)查:概念、方法和挑戰(zhàn)

共熵服務(wù)中心 ? 來(lái)源:未知 ? 2022-11-16 20:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自《ACM技術(shù)洞察》科學(xué)雜志上的一篇文章:《Survey on Digital Video Stabilization: Concepts, Methods, and Challenges》,原文鏈接如下:

https://dl.acm.org/doi/pdf/10.1145/3494525


CSUR-IG是誰(shuí)?

CSUR-IG是計(jì)算調(diào)研興趣小組 Computing SURveys Interest Group的縮寫。我們是ACM技術(shù)洞察研究團(tuán)隊(duì)。我們是來(lái)自4個(gè)地方的同學(xué):

1名深圳大學(xué)大三學(xué)生

2名中原工學(xué)院研一學(xué)生

1名安陽(yáng)工學(xué)院大三學(xué)生

1名南通科技學(xué)院大三學(xué)生

我們?cè)?a target="_blank">OpenHarmony成長(zhǎng)計(jì)劃啃論文俱樂(lè)部里,與華為、軟通動(dòng)力、鴻湖萬(wàn)聯(lián)等公司一起,學(xué)習(xí)和研究操作系統(tǒng)技術(shù)…


1. 簡(jiǎn)介

1.1 本文摘要

數(shù)字視頻穩(wěn)定是一項(xiàng)具有挑戰(zhàn)性的任務(wù),旨在通過(guò)平滑相機(jī)軌跡將可能不穩(wěn)定的視頻轉(zhuǎn)換為令人愉快的視頻。

穩(wěn)定可以借助硬件(穩(wěn)定器)的方式實(shí)現(xiàn),也可以通過(guò)軟件算法的方式實(shí)現(xiàn)。本文談的是后者。

盡管在解決這一任務(wù)的文獻(xiàn)中發(fā)現(xiàn)了各種作品,但它們的組織和分析尚未受到太多關(guān)注。在這項(xiàng)工作中,我們根據(jù)提議的分類法對(duì)視頻穩(wěn)定的文獻(xiàn)進(jìn)行了全面回顧。介紹了該問(wèn)題的正式定義,以及物理術(shù)語(yǔ)的簡(jiǎn)要解釋。我們還就這一活躍領(lǐng)域的主要挑戰(zhàn)和未來(lái)趨勢(shì)進(jìn)行了全面討論。

1.2 數(shù)字視頻穩(wěn)定的定義

數(shù)字視頻穩(wěn)定就是通過(guò)平滑相機(jī)軌跡將可能不穩(wěn)定的視頻轉(zhuǎn)換為令人愉快的視頻。視頻可以表示為一系列照片(幀)。

圖中,真實(shí)世界裁剪(白色)產(chǎn)生的照片和視頻(藍(lán)色)的表示。左:以矩形表示的照片。中間和右側(cè):以音量表示的穩(wěn)定和不穩(wěn)定視頻。

數(shù)字視頻穩(wěn)定就想解決不用設(shè)備(直接用手)的情況下,把視頻拍得好看,很有商業(yè)價(jià)值。


2. 正式定義和分類

2.1 相機(jī)運(yùn)動(dòng)方法

我拿著相機(jī),可以前后左右走,舉高舉低(第一個(gè)圖),我拍特別角度,拿著相機(jī)轉(zhuǎn)(第二個(gè)圖),合起來(lái)就是復(fù)雜運(yùn)動(dòng)(第三個(gè)圖)。

2.2數(shù)字視頻穩(wěn)定的一些方法

2.2.1 經(jīng)典的方法(三步走):

數(shù)字視頻穩(wěn)定的典型過(guò)程涉及三個(gè)不同的步驟,如下圖所示:(1) 攝像機(jī)運(yùn)動(dòng)估計(jì),(2) 不需要的運(yùn)動(dòng)確定,以及 (3) 穩(wěn)定視圖渲染。

2.2.2 基于深度學(xué)習(xí)的方法:

深度學(xué)習(xí)的方法提出了深度神經(jīng)網(wǎng)絡(luò)架構(gòu),以有監(jiān)督或無(wú)監(jiān)督的方式穩(wěn)定視頻。


3.主要挑戰(zhàn)場(chǎng)景

3.1相機(jī)的估計(jì)運(yùn)動(dòng)

拍攝的過(guò)程中,人會(huì)帶著相機(jī)運(yùn)動(dòng),拍攝的事物也會(huì)運(yùn)動(dòng),組合起來(lái)就是表觀運(yùn)動(dòng),也就是拍出來(lái)的東西。相機(jī)的估計(jì)運(yùn)動(dòng)就是通過(guò)表觀運(yùn)動(dòng)(拍出來(lái)的東西)估計(jì)出相機(jī)本身是怎么運(yùn)動(dòng)的。

相機(jī)運(yùn)動(dòng)估計(jì)技術(shù)地圖,主要講了估計(jì)出相機(jī)本身是怎么運(yùn)動(dòng)中2D(二維),3D(三維)和2.5D(混合方法)的一些處理方法,并且給出了相應(yīng)的描述和優(yōu)缺點(diǎn)比較:

表 1. 對(duì)數(shù)字視頻穩(wěn)定中攝像機(jī)運(yùn)動(dòng)估計(jì)的進(jìn)步做出貢獻(xiàn)的一些主要工作總結(jié)

3.2怎么確定不需要的運(yùn)動(dòng)

拍攝過(guò)程中因?yàn)椴槐匾亩秳?dòng)導(dǎo)致畫質(zhì)不好,這種運(yùn)動(dòng)需要確定,就是確定不需要的運(yùn)動(dòng)。

不需要的運(yùn)動(dòng)確認(rèn)技術(shù)地圖,主要講了為了去除的不需要的運(yùn)動(dòng)部分以獲得更平滑的路徑中基于過(guò)濾的方法,基于插值的方法,基于優(yōu)化的方法,并且給出了相應(yīng)的描述和優(yōu)缺點(diǎn)比較:

表 2. 有助于推動(dòng)數(shù)字視頻穩(wěn)定中的無(wú)用運(yùn)動(dòng)確定的一些主要工作總結(jié)

3.3穩(wěn)定視圖渲染

我們要處理一些丟失或者模糊的幀,也就是幀的修復(fù)。

穩(wěn)定渲染的技術(shù)地圖,主要講了渲染穩(wěn)定的幀中中基于填充的方法和基于裁剪的方法,并且給出了相應(yīng)的描述和優(yōu)缺點(diǎn)比較:

表 3. 推動(dòng)數(shù)字視頻穩(wěn)定渲染新視圖的一些主要工作總

4.基于深度學(xué)習(xí)的方法

基于深度學(xué)習(xí)的視頻穩(wěn)定方法,大多數(shù)使用帶有配對(duì)視頻的數(shù)據(jù)集進(jìn)行訓(xùn)練,其中每一對(duì)都有一個(gè)不穩(wěn)定的和一個(gè)真實(shí)穩(wěn)定的視頻。在這種情況下,如下圖所示,目標(biāo)是找到一個(gè)網(wǎng)絡(luò),該網(wǎng)絡(luò)從不穩(wěn)定版本中預(yù)測(cè)幀,使其與穩(wěn)定版本盡可能相似。

圖中,基于深度學(xué)習(xí)的方法中常用的方法。不穩(wěn)定的幀和一些時(shí)間信息提供給深度網(wǎng)絡(luò),以在訓(xùn)練/推理階段預(yù)測(cè)穩(wěn)定/穩(wěn)定的幀。

深度學(xué)習(xí)數(shù)字視頻穩(wěn)定技術(shù)地圖,這種方法沒(méi)有明確地估計(jì)相機(jī)運(yùn)動(dòng),但他們使用的是表觀運(yùn)動(dòng)。通常,不需要的運(yùn)動(dòng)的確定和移除是隱式完成的:網(wǎng)絡(luò)學(xué)習(xí)預(yù)測(cè)類似于真實(shí)穩(wěn)定視頻的視頻,以下就是給出論文技術(shù)的盤點(diǎn):

表 4. 基于深度神經(jīng)網(wǎng)絡(luò)執(zhí)行數(shù)字視頻穩(wěn)定的方法總結(jié)

5.結(jié)論

5.1 過(guò)去的回顧
這項(xiàng)工作對(duì)數(shù)字視頻穩(wěn)定文獻(xiàn)中可用的方法進(jìn)行了回顧。我們根據(jù)使用的方法對(duì)方法進(jìn)行分類,無(wú)論是經(jīng)典的還是基于深度學(xué)習(xí)的。經(jīng)典方法分為三個(gè)主要階段:(1)相機(jī)運(yùn)動(dòng)估計(jì),(2)確定不需要的運(yùn)動(dòng),以及(3)穩(wěn)定幀的渲染。對(duì)于這些步驟中的每一個(gè),我們定義并分類了這些方法。
5.2本文結(jié)論
  • 一些實(shí)際應(yīng)用可以受益于數(shù)字視頻穩(wěn)定及其開發(fā)所產(chǎn)生的知識(shí)。

  • 需要更好地定義使用這些方法的場(chǎng)景。

  • 與其計(jì)算機(jī)視覺領(lǐng)域類似,深度學(xué)習(xí)已成為近年來(lái)視頻穩(wěn)定的趨勢(shì)。

  • 數(shù)字視頻穩(wěn)定文獻(xiàn)中的關(guān)鍵點(diǎn)之一是還沒(méi)有明確定義的評(píng)估指標(biāo)。

<本文完>


寫在最后


OpenHarmony 成長(zhǎng)計(jì)劃—“啃論文俱樂(lè)部”(以下簡(jiǎn)稱“啃論文俱樂(lè)部”)是在 2022年 1 月 11 日的一次日?;顒?dòng)中誕生的。截至 3 月 31 日,啃論文俱樂(lè)部已有 87 名師生和企業(yè)導(dǎo)師參與,目前共有十二個(gè)技術(shù)方向并行探索,每個(gè)方向都有專業(yè)的技術(shù)老師帶領(lǐng)同學(xué)們通過(guò)啃綜述論文制定技術(shù)地圖,按“降龍十八掌”的學(xué)習(xí)方法編排技術(shù)開發(fā)內(nèi)容,并通過(guò)專業(yè)推廣培養(yǎng)高校開發(fā)者成為軟件技術(shù)學(xué)術(shù)級(jí)人才。


啃論文俱樂(lè)部的宗旨是希望同學(xué)們?cè)陂_源活動(dòng)中得到軟件技術(shù)能力提升、得到技術(shù)寫作能力提升、得到講解技術(shù)能力提升。大學(xué)一年級(jí)新生〇門檻參與,已有俱樂(lè)部來(lái)自多所高校的大一同學(xué)寫出高居榜首的技術(shù)文章。


如今,搜索“啃論文”,人們不禁想到、而且看到的都是我們——OpenHarmony 成長(zhǎng)計(jì)劃—“啃論文俱樂(lè)部”的產(chǎn)出。






OpenHarmony開源與開發(fā)者成長(zhǎng)計(jì)劃—“啃論文俱樂(lè)部”學(xué)習(xí)資料合集


1)入門資料:啃論文可以有怎樣的體驗(yàn)

https://docs.qq.com/slide/DY0RXWElBTVlHaXhi?u=4e311e072cbf4f93968e09c44294987d


2)操作辦法:怎么從啃論文到開源提交以及深度技術(shù)文章輸出https://docs.qq.com/slide/DY05kbGtsYVFmcUhU


3)企業(yè)/學(xué)校/老師/學(xué)生為什么要參與 & 啃論文俱樂(lè)部的運(yùn)營(yíng)辦法https://docs.qq.com/slide/DY2JkS2ZEb2FWckhq


4)往期啃論文俱樂(lè)部同學(xué)分享會(huì)精彩回顧:

同學(xué)分享會(huì)No1.成長(zhǎng)計(jì)劃啃論文分享會(huì)紀(jì)要(2022/02/18)https://docs.qq.com/doc/DY2RZZmVNU2hTQlFY

同學(xué)分享會(huì)No.2 成長(zhǎng)計(jì)劃啃論文分享會(huì)紀(jì)要(2022/03/11)https://docs.qq.com/doc/DUkJ5c2NRd2FRZkhF

同學(xué)們分享會(huì)No.3 成長(zhǎng)計(jì)劃啃論文分享會(huì)紀(jì)要(2022/03/25)

https://docs.qq.com/doc/DUm5pUEF3ck1VcG92?u=4e311e072cbf4f93968e09c44294987d


現(xiàn)在,你是不是也熱血沸騰,摩拳擦掌地準(zhǔn)備加入這個(gè)俱樂(lè)部呢?當(dāng)然歡迎啦!啃論文俱樂(lè)部向任何對(duì)開源技術(shù)感興趣的大學(xué)生開發(fā)者敞開大門。



掃碼添加 OpenHarmony 高校小助手,加入“啃論文俱樂(lè)部”微信群


后續(xù),我們會(huì)在服務(wù)中心公眾號(hào)陸續(xù)分享一些 OpenHarmony 開源與開發(fā)者成長(zhǎng)計(jì)劃—“啃論文俱樂(lè)部”學(xué)習(xí)心得體會(huì)和總結(jié)資料。記得呼朋引伴來(lái)看哦。

























原文標(biāo)題:數(shù)字視頻穩(wěn)定調(diào)查:概念、方法和挑戰(zhàn)

文章出處:【微信公眾號(hào):開源技術(shù)服務(wù)中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    389

    瀏覽量

    8172
  • OpenHarmony
    +關(guān)注

    關(guān)注

    29

    文章

    3854

    瀏覽量

    18608

原文標(biāo)題:數(shù)字視頻穩(wěn)定調(diào)查:概念、方法和挑戰(zhàn)

文章出處:【微信號(hào):開源技術(shù)服務(wù)中心,微信公眾號(hào):共熵服務(wù)中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GM7121-D視頻編碼芯片技術(shù)解析與應(yīng)用指南

    (電子工程師參考版) ? #### 一、器件概述 ? GM7121-D是成都振芯科技股份有限公司推出的一款高性能視頻編碼芯片,專用于數(shù)字視頻信號(hào)到模擬復(fù)合視頻信號(hào)的轉(zhuǎn)換。其核心功能包括數(shù)字視頻
    的頭像 發(fā)表于 04-23 15:27 ?281次閱讀

    混合信號(hào)設(shè)計(jì)的概念、挑戰(zhàn)與發(fā)展趨勢(shì)

    本文介紹了集成電路設(shè)計(jì)領(lǐng)域中混合信號(hào)設(shè)計(jì)的概念、挑戰(zhàn)與發(fā)展趨勢(shì)。
    的頭像 發(fā)表于 04-01 10:30 ?607次閱讀

    以智能制造為導(dǎo)向的數(shù)字孿生工廠構(gòu)建方法與應(yīng)用

    數(shù)字孿生工廠的構(gòu)建方法與應(yīng)用,以期為制造企業(yè)實(shí)現(xiàn)智能制造提供參考與指導(dǎo)。 1?數(shù)字孿生的概念及內(nèi)涵 1.1?數(shù)字孿生的
    的頭像 發(fā)表于 01-06 10:41 ?481次閱讀

    從DP到HDMI,山澤連接新的橋梁

    山澤是一個(gè)專注于設(shè)計(jì)和制造高質(zhì)量音視頻連接線材及配件的品牌。它以提供穩(wěn)定可靠的信號(hào)傳輸解決方案而聞名,尤其是在數(shù)字視頻接口(如DP,即DisplayPort)到模擬或其它類型的數(shù)字視頻
    的頭像 發(fā)表于 12-19 17:43 ?640次閱讀

    視頻目標(biāo)跟蹤從0到1,概念方法

    視覺目標(biāo)跟蹤的挑戰(zhàn)和算法模型,最后,我們將介紹最流行的基于深度學(xué)習(xí)的目標(biāo)跟蹤方法,包括MDNET,GOTURN,ROLO等。本文希望你
    的頭像 發(fā)表于 11-20 01:06 ?910次閱讀
    <b class='flag-5'>視頻</b>目標(biāo)跟蹤從0到1,<b class='flag-5'>概念</b>與<b class='flag-5'>方法</b>

    愛普生XV-3510CB陀螺儀傳感器實(shí)現(xiàn)圖像穩(wěn)定與運(yùn)動(dòng)檢測(cè)功能

    適合應(yīng)用于需要高度穩(wěn)定性和精度的場(chǎng)景,特別是在數(shù)字視頻穩(wěn)定器(DVC)與動(dòng)態(tài)穩(wěn)定相機(jī)(DSC)的圖像穩(wěn)定性監(jiān)測(cè)領(lǐng)域,以及具有人機(jī)交互界面的運(yùn)
    的頭像 發(fā)表于 10-31 13:57 ?739次閱讀
    愛普生XV-3510CB陀螺儀傳感器實(shí)現(xiàn)圖像<b class='flag-5'>穩(wěn)定</b>與運(yùn)動(dòng)檢測(cè)功能

    使用dp接口播放4K視頻的技巧

    的硬件支持和一些技巧。 1. 了解dp接口 dp接口是一種數(shù)字視頻和音頻接口標(biāo)準(zhǔn),主要用于連接顯示器和視頻源設(shè)備。它支持高分辨率視頻傳輸,包括4K和更高級(jí)別的分辨率。為了播放4K視頻,
    的頭像 發(fā)表于 10-30 13:56 ?1588次閱讀

    使用DaVinci SoC的數(shù)字視頻

    電子發(fā)燒友網(wǎng)站提供《使用DaVinci SoC的數(shù)字視頻.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 09:51 ?0次下載
    使用DaVinci SoC的<b class='flag-5'>數(shù)字視頻</b>

    視頻時(shí)鐘合成芯片怎么用

    格式,以確保視頻信號(hào)的同步和穩(wěn)定。以下是關(guān)于視頻時(shí)鐘合成芯片的使用指南: 1. 視頻時(shí)鐘合成芯片的基本概念
    的頭像 發(fā)表于 10-10 11:17 ?734次閱讀

    FPD link系統(tǒng)概念與診斷調(diào)試方法

    電子發(fā)燒友網(wǎng)站提供《FPD link系統(tǒng)概念與診斷調(diào)試方法.pdf》資料免費(fèi)下載
    發(fā)表于 09-27 11:11 ?0次下載
    FPD link系統(tǒng)<b class='flag-5'>概念</b>與診斷調(diào)試<b class='flag-5'>方法</b>

    AM62x上的數(shù)字儀表組和安全概念

    電子發(fā)燒友網(wǎng)站提供《AM62x上的數(shù)字儀表組和安全概念.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 10:45 ?0次下載
    AM62x上的<b class='flag-5'>數(shù)字</b>儀表組和安全<b class='flag-5'>概念</b>

    SDI接口的基本概念、技術(shù)特點(diǎn)及應(yīng)用

    SDI接口,即串行數(shù)字接口(Serial Digital Interface),是一種用于傳輸數(shù)字視頻信號(hào)的接口標(biāo)準(zhǔn)。它廣泛應(yīng)用于廣播、電影制作、后期制作等領(lǐng)域。 一、SDI接口的基本概念 1.1
    的頭像 發(fā)表于 08-20 15:17 ?7601次閱讀

    SDI接口的基本概念及傳輸信號(hào)類型

    SDI(Serial Digital Interface,串行數(shù)字接口)是一種用于傳輸數(shù)字視頻信號(hào)的接口標(biāo)準(zhǔn)。它廣泛應(yīng)用于廣播、電影制作、后期制作等領(lǐng)域。 一、SDI接口的基本概念 1.1 SDI
    的頭像 發(fā)表于 08-20 15:01 ?9075次閱讀

    sdi是數(shù)字信號(hào)還是模擬信號(hào)

    SDI(Serial Digital Interface)是一種數(shù)字信號(hào)接口,用于傳輸未壓縮的數(shù)字視頻和音頻信號(hào)。 SDI的概念 SDI是一種串行數(shù)字接口,主要用于傳輸高清晰度電視(H
    的頭像 發(fā)表于 08-20 14:29 ?3059次閱讀

    英偉達(dá)面臨雙重反壟斷調(diào)查挑戰(zhàn)

    英偉達(dá),這家在人工智能芯片領(lǐng)域占據(jù)領(lǐng)先地位的科技公司,近期遭遇了前所未有的挑戰(zhàn)。在享受了數(shù)月由AI芯片需求激增帶來(lái)的股價(jià)暴漲和市場(chǎng)樂(lè)觀情緒后,英偉達(dá)不得不面對(duì)來(lái)自監(jiān)管機(jī)構(gòu)的雙重反壟斷調(diào)查
    的頭像 發(fā)表于 08-14 11:45 ?960次閱讀