一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

神經(jīng)網(wǎng)絡(luò)還有另一種用法,那就是對圖像進行增強

倩倩 ? 來源:環(huán)球網(wǎng) ? 2020-04-17 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說到神經(jīng)網(wǎng)絡(luò),你第一個想到的什么,有不少人第一個想到的應(yīng)該是前段時間大火的換臉 APP“ZAO”,神經(jīng)網(wǎng)絡(luò)在圖片領(lǐng)域堪稱“魔法”的應(yīng)用第一次展現(xiàn)在每一個普通用戶面前。

不少用戶在使用過ZAO后,對神經(jīng)網(wǎng)絡(luò)產(chǎn)生了“技術(shù)恐懼”,擔心ZAO會對自己的肖像權(quán)產(chǎn)生侵害,ZAO也因為種種原因迅速下架,成為技術(shù)應(yīng)用的“負面典型”。

但神經(jīng)網(wǎng)絡(luò)還有另一種用法,那就是對圖像進行增強。

神經(jīng)網(wǎng)絡(luò)翻新老電影

最近,國外一個YouTuber發(fā)布了通過神經(jīng)網(wǎng)絡(luò)增強的1895年拍攝的紀錄片《火車進站》,整部電影只有45秒長度,由路易·盧米埃和奧古斯特·盧米埃拍攝于法國一沿海城市。

傳說放映到火車駛向鏡頭的時候,大量觀眾驚恐的從劇院跑出,展現(xiàn)了當時人們對新技術(shù)的好奇和恐懼。當然,這些往事都已經(jīng)成為了都市傳說。

不過由“新技術(shù)”的神經(jīng)網(wǎng)絡(luò)對這部電影進行翻新,也有著深遠的意義。

1895年拍攝的《火車進站》采用35mm格式膠片制作,由于當時的放映機由手搖進行驅(qū)動,我們可以粗略的認為其原始幀率在16幀到24幀之間。

由于當時的膠片技術(shù)尚未成熟,我們可以看到畫面景物都是比較模糊的,火車在駛來的同時還帶有明顯的拖影。

但經(jīng)過了神經(jīng)網(wǎng)絡(luò)的畫面分辨率增強和插幀之后,這部老電影獲得了4K ~ 60fps的畫質(zhì)。如果不是電影黑白的畫面和膠片電影獨有的畫面抖動,畫面流暢度和清晰度幾乎可以與現(xiàn)在的智能手機相媲美。

是什么讓神經(jīng)網(wǎng)絡(luò)在圖像增強和插幀上有著這樣的效果呢?

我們知道,數(shù)字視頻的清晰度一般由分辨率和幀率決定(暫且不考慮影響圖像壓縮質(zhì)量的碼率)。神經(jīng)網(wǎng)絡(luò)對視頻的增強,也主要集中在這兩種參數(shù)上。

分辨率增強

首先我們來談?wù)劮直媛试鰪姡胍獙⒁粡埖头直媛实膱D片變成高分辨率的圖片,我們就需要猜測放大產(chǎn)生的未知像素。通常情況下,我們會采用某種插值算法進行計算,在圖像邊緣的模糊和鋸齒間獲得平衡,這種計算通常無法增加圖像細節(jié),即使放大了圖像,依舊顯得很模糊。

神經(jīng)網(wǎng)絡(luò)在增強分辨率上就有著獨到的優(yōu)勢,或許你之前曾經(jīng)聽說過一個軟件waifu2x ,動漫愛好者們經(jīng)常用它來放大動漫插圖。當然,它同樣可以用作照片放大。

waifu2x的核心方法就是通過機器學習,訓練一個端到端的網(wǎng)絡(luò),使用低分辨率的圖像作為輸入得到對應(yīng)的高分辨率結(jié)果圖像,最后得到的結(jié)果在圖像的鋸齒與模糊程度有較好表現(xiàn),其訓練的原理類似于FCN模型。

在效果上,waifu2x的SRCNN(超分辨率卷積神經(jīng)網(wǎng)絡(luò))要好于傳統(tǒng)的雙三次插值算法。

當然,waifu2x的算法僅能在靜態(tài)圖片上使用。不過方法都是相同的,madvr 中放大視頻分辨率的ngu算法也是類似的原理。

視頻插幀

對于視頻插幀來說,神經(jīng)網(wǎng)絡(luò)也有自己的用武之地,之前英偉達發(fā)布了一個叫做Super SloMo的神經(jīng)網(wǎng)絡(luò),能通過聯(lián)合建模的運動解釋和遮擋推理配合光流算法生成中間幀。

這種技術(shù)能將原本30幀的視頻放慢到240幀,并在其中添加畫面的運動細節(jié)。

華為Mate 30 Pro的7680幀慢動作,也是通過神經(jīng)網(wǎng)絡(luò)對1080P/960fps 的視頻插幀生成的??梢婎愃频纳窠?jīng)網(wǎng)絡(luò)插幀算法確實有很高的使用價值。

寫在最后:技術(shù)是一把雙刃劍

可以看到,神經(jīng)網(wǎng)絡(luò)對圖像的處理(也就是常說的AI圖像)并不是一個很可怕技術(shù),它是一把雙刃劍,如果你用它來給視頻換臉,侵犯他人肖像權(quán),它就是不好的技術(shù)。

但如果我們能將其用在老電影翻新、手機超級慢動作、和實時視頻增強,那它就是好技術(shù)。

或許那位翻新《火車進站》的YouTuber,也正是想用這部電影的傳奇故事告訴我們,“不要恐懼新技術(shù)的到來?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103573
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    41240
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)在多個方面存在顯著差異,以下是對兩者的比較: 、結(jié)構(gòu)特點 BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 02-12 15:53 ?661次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點分析

    BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)作為一種常用的機器學習模型,具有顯著的優(yōu)點,同時也存在些不容忽視的缺點。以下是對BP神經(jīng)網(wǎng)絡(luò)優(yōu)缺點的分析
    的頭像 發(fā)表于 02-12 15:36 ?914次閱讀

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法(Backpropagation Algorithm)是一種用于訓練神經(jīng)網(wǎng)絡(luò)的有效方法。以下是關(guān)于BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法的介紹:
    的頭像 發(fā)表于 02-12 15:18 ?765次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學習的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法進行訓練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、個或多個隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整
    的頭像 發(fā)表于 02-12 15:15 ?851次閱讀

    BP神經(jīng)網(wǎng)絡(luò)圖像識別中的應(yīng)用

    傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network),是一種多層前饋神經(jīng)網(wǎng)絡(luò),主要通過反向傳播算法進行學習。它通常包括輸入層、
    的頭像 發(fā)表于 02-12 15:12 ?671次閱讀

    文詳解物理信息神經(jīng)網(wǎng)絡(luò)

    物理信息神經(jīng)網(wǎng)絡(luò) (PINN) 是一種神經(jīng)網(wǎng)絡(luò),它將微分方程描述的物理定律納入其損失函數(shù)中,以引導學習過程得出更符合基本物理定律的解。
    的頭像 發(fā)表于 12-05 16:50 ?8331次閱讀
    <b class='flag-5'>一</b>文詳解物理信息<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    使用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分類的步驟

    使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進行圖像分類是個涉及多個步驟的過程。 1. 問題定義 確定目標 :明確你想要分類的圖像類型,例如貓和狗、不同的植
    的頭像 發(fā)表于 11-15 15:01 ?843次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    在深度學習領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識別、自然語言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是兩
    的頭像 發(fā)表于 11-15 14:53 ?1865次閱讀

    深度學習中的卷積神經(jīng)網(wǎng)絡(luò)模型

    卷積神經(jīng)網(wǎng)絡(luò)一種前饋神經(jīng)網(wǎng)絡(luò),其靈感來源于生物的視覺皮層機制。它通過模擬人類視覺系統(tǒng)的處理方式,能夠自動提取圖像特征,從而在圖像識別和分
    的頭像 發(fā)表于 11-15 14:52 ?844次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本原理與算法

    ),是深度學習的代表算法之。 、基本原理 卷積運算 卷積運算是卷積神經(jīng)網(wǎng)絡(luò)的核心,用于提取圖像中的局部特征。 定義卷積核:卷積核是個小
    的頭像 發(fā)表于 11-15 14:47 ?1773次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)是機器學習領(lǐng)域中的一種強大工具,它們能夠模擬人腦處理信息的方式。隨著技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的類型也在不斷增加,其中循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和傳統(tǒng)
    的頭像 發(fā)表于 11-15 09:42 ?1125次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)圖像處理中的應(yīng)用

    長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它能夠?qū)W習長期依賴關(guān)系。雖然LSTM最初是為處理序列數(shù)據(jù)設(shè)計的,但近年來,它在圖像處理領(lǐng)域也展現(xiàn)出了巨大的潛力。 LS
    的頭像 發(fā)表于 11-13 10:12 ?1614次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與工作機制

    LSTM(Long Short-Term Memory,長短期記憶)神經(jīng)網(wǎng)絡(luò)一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),設(shè)計用于解決長期依賴問題,特別是在處理時間序列數(shù)據(jù)時表現(xiàn)出色。以下是LSTM神經(jīng)
    的頭像 發(fā)表于 11-13 10:05 ?1628次閱讀

    基于差分卷積神經(jīng)網(wǎng)絡(luò)的低照度車牌圖像增強網(wǎng)絡(luò)

    車牌識別作為現(xiàn)代化智能交通系統(tǒng)中重要的環(huán)節(jié),對提升路網(wǎng)效率以及緩解城市交通壓力等問題具有重要的社會意義,然而弱光照車牌圖像識別仍然具有重大的挑戰(zhàn)。構(gòu)建了個基于差分卷積神經(jīng)網(wǎng)絡(luò)的弱光照車牌圖像
    的頭像 發(fā)表于 11-11 10:29 ?793次閱讀
    基于差分卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的低照度車牌<b class='flag-5'>圖像</b><b class='flag-5'>增強</b><b class='flag-5'>網(wǎng)絡(luò)</b>

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    取特征的強大工具,例如識別音頻信號或圖像信號中的復雜模式就是其應(yīng)用之。 1、什么是卷積神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 10-24 13:56