一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種用于音樂源分離的新型深度學(xué)習(xí)系統(tǒng)

倩倩 ? 來源:互聯(lián)網(wǎng)分析沙龍 ? 2020-03-22 15:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Facebook Research最近發(fā)布了Demucs,這是一種用于音樂源分離的新型深度學(xué)習(xí)系統(tǒng)。根據(jù)人類對分離后聲音總體質(zhì)量的評估,Demucs的性能優(yōu)于先前報道的結(jié)果。

音樂源分離是經(jīng)過大量研究的一種應(yīng)用,稱為盲源分離。該過程包括在不借助元信息的情況下從一組混合信號中分離出一組源信號。對于音樂,各個組成部分可能包括人聲或其他樂器軌道。當(dāng)空中交通管制員開始在單個揚(yáng)聲器上聽到多個飛行員的混合聲音時出現(xiàn)問題時,源分離領(lǐng)域首先受到了廣泛關(guān)注。這導(dǎo)致英國科學(xué)家科林·切里(Colin Cherry)在1953年將這種效應(yīng)稱為“雞尾酒會問題”。

在源分離領(lǐng)域的現(xiàn)有研究的推動下,研究科學(xué)家于2000年代初開始使用AI分離音樂中的聲音。如今,短時傅立葉變換產(chǎn)生的頻譜圖(STFT)是最新音樂源分離的核心。這些系統(tǒng)在每個幀和每個源的幅度譜上產(chǎn)生一個掩碼,并且通過在掩碼頻譜圖上運(yùn)行逆STFT的同時重新使用輸入混合相位,來生成輸出音頻。

建立在頻譜圖分析基礎(chǔ)上的系統(tǒng)在諸如中音鋼琴或連奏小提琴之類的樂器的源分離方面表現(xiàn)出色,因為它們可以產(chǎn)生一致的頻率和振鈴。但是,這些系統(tǒng)很難隔離敲擊聲音,因為敲擊樂器所產(chǎn)生的殘留噪聲會產(chǎn)生更寬的頻率范圍,并且當(dāng)與多個樂器的重疊相結(jié)合時,信息就會丟失,并且掩蓋操作將使信息不再可逆。

Demucs是一種深度學(xué)習(xí)模型,可直接對原始輸入波形進(jìn)行操作并為每個源生成一個波形。U-net體系結(jié)構(gòu)使用卷積編碼器和解碼器,該解碼器和解碼器基于跨步卷積較大的步幅。波形模型的工作方式與常見的計算機(jī)視覺模型相似,因為它們都使用神經(jīng)網(wǎng)絡(luò)在推斷更高級別的模式之前先檢測基本模式。

基于頻譜圖的模型優(yōu)于Wave-U-Net,后者是Demucs之前最先進(jìn)的基于波形的模型。Demucs建立在Wave-U-Net體系結(jié)構(gòu)的基礎(chǔ)上,具有可調(diào)整的超參數(shù)和較長的短期內(nèi)存,允許網(wǎng)絡(luò)處理整個數(shù)據(jù)序列,而不是單個數(shù)據(jù)點。

這些改進(jìn)幫助系統(tǒng)解決了一個聲音超過另一個聲音的問題,因為解碼器足夠聰明,可以填充柔和的音符。

人類在MusDB數(shù)據(jù)集上評估Demucs,并將其與其他最新的源分離系統(tǒng)的結(jié)果進(jìn)行比較。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傅立葉變換
    +關(guān)注

    關(guān)注

    3

    文章

    105

    瀏覽量

    32899
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122798
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    一種新型寬帶鞭狀套筒天線

    電子發(fā)燒友網(wǎng)站提供《一種新型寬帶鞭狀套筒天線.pdf》資料免費(fèi)下載
    發(fā)表于 05-28 14:05 ?0次下載

    一種新型激光雷達(dá)慣性視覺里程計系統(tǒng)介紹

    針對具有挑戰(zhàn)性的光照條件和惡劣環(huán)境,本文提出了LIR-LIVO,這是一種輕量級且穩(wěn)健的激光雷達(dá)-慣性-視覺里程計系統(tǒng)。通過采用諸如利用深度與激光雷達(dá)點云關(guān)聯(lián)實現(xiàn)特征的均勻深度分布等先進(jìn)
    的頭像 發(fā)表于 04-28 11:18 ?358次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>激光雷達(dá)慣性視覺里程計<b class='flag-5'>系統(tǒng)</b>介紹

    一種新型直流電機(jī)控制器

    以前控制直流電機(jī)多由單片機(jī)完成。該方式缺點是接口繁瑣、速度慢,且不易在高溫、高壓等惡劣環(huán)境下工作[1]。采用一種新型直流電機(jī)控制器——DSP 控制器解決了單片機(jī)控制的缺點,其具備很多優(yōu)點,該控制器
    發(fā)表于 03-25 15:25

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法進(jìn)行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、個或多個隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整網(wǎng)絡(luò)權(quán)重,目的是最小化網(wǎng)絡(luò)的輸出誤差。 二、深度學(xué)習(xí)
    的頭像 發(fā)表于 02-12 15:15 ?863次閱讀

    文讀懂網(wǎng)荷儲體化、虛擬電廠、微電網(wǎng)三業(yè)務(wù)之間的關(guān)系

    的,接下來我們從以下幾個方面來剖析下三類業(yè)務(wù)之間的關(guān)系。 、定義 1. 網(wǎng)荷儲體化 ? ? ?? 網(wǎng)荷儲體化是
    的頭像 發(fā)表于 12-20 11:24 ?1827次閱讀
    <b class='flag-5'>一</b>文讀懂<b class='flag-5'>源</b>網(wǎng)荷儲<b class='flag-5'>一</b>體化、虛擬電廠、微電網(wǎng)三<b class='flag-5'>種</b>業(yè)務(wù)之間的關(guān)系

    一種新型高效率的服務(wù)器電源系統(tǒng)

    一種新型高效率的服務(wù)器電源系統(tǒng)
    發(fā)表于 12-19 16:45 ?1次下載

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計的硬件加速器,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學(xué)習(xí)算法優(yōu)化的處理器,它與傳統(tǒng)的CPU和G
    的頭像 發(fā)表于 11-14 15:17 ?1918次閱讀

    pcie在深度學(xué)習(xí)中的應(yīng)用

    與主機(jī)系統(tǒng)連接,提供必要的計算支持。 2. PCIe技術(shù)概述 PCIe是一種點對點串行連接,用于計算機(jī)內(nèi)部硬件組件之間的連接。它以其高速數(shù)據(jù)傳輸能力和低延遲特性而聞名,是連接高性能硬件(如GPU)的理想選擇。 高速數(shù)據(jù)傳輸 :P
    的頭像 發(fā)表于 11-13 10:39 ?1352次閱讀

    一種基于深度學(xué)習(xí)的二維拉曼光譜算法

    近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實驗室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發(fā)表于 11-07 09:08 ?741次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的二維拉曼光譜算法

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識別、自動駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過程。 二、自然語言處理 自然語言處理(NLP)是深度
    的頭像 發(fā)表于 10-27 11:13 ?1381次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    、激光雷達(dá)技術(shù)概述 激光雷達(dá)技術(shù)是一種基于激光的遙感技術(shù),通過發(fā)射激光脈沖并接收反射回來的光來測量物體的距離和速度。與傳統(tǒng)的雷達(dá)技術(shù)相比,激光雷達(dá)具有更高的分辨率和精度,能夠提供更詳細(xì)的三維空間
    的頭像 發(fā)表于 10-27 10:57 ?1071次閱讀

    一種新型電流模式控制集成電路

    電子發(fā)燒友網(wǎng)站提供《一種新型電流模式控制集成電路.pdf》資料免費(fèi)下載
    發(fā)表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>電流模式控制集成電路

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對兩者關(guān)系的介紹: 、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :
    的頭像 發(fā)表于 10-23 15:25 ?2897次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題() Q:FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?現(xiàn)在用FPGA做深度學(xué)習(xí)加速成為
    發(fā)表于 09-27 20:53

    一種新型全光學(xué)智能光譜儀

    近日,北京理工大學(xué)光電學(xué)院許廷發(fā)教授科研團(tuán)隊與清華大學(xué)林星助理教授團(tuán)隊聯(lián)合開發(fā)了一種新型全光學(xué)智能光譜儀(Opto-Intelligence Spectrometer, OIS)。
    的頭像 發(fā)表于 07-31 06:18 ?677次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>全光學(xué)智能光譜儀