一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用非監(jiān)督學(xué)習(xí)實(shí)現(xiàn)了不同音樂間的樂器、體裁和風(fēng)格間的轉(zhuǎn)換

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-06-16 16:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Facebook上月末發(fā)表了一篇名為“A Universal Music Translation Network”的文章(原文鏈接在文末),詳細(xì)闡述了如何利用非監(jiān)督學(xué)習(xí)實(shí)現(xiàn)了不同音樂間的樂器、體裁和風(fēng)格間的轉(zhuǎn)換。相信小伙伴們或多或少地了解過這篇論文。

但是如果從音樂家的角度來看這個(gè)過程是如何進(jìn)行的呢?本文將從四個(gè)不同的層次帶領(lǐng)我們更深入地理解這篇論文中所描述的方法,看看到底是什么神奇的魔力將長(zhǎng)笛的悠揚(yáng)轉(zhuǎn)換為了鋼琴的動(dòng)聽的。

level-0:新手

對(duì)于新手來說想要快速實(shí)現(xiàn)風(fēng)格轉(zhuǎn)換,傅里葉變換將是一個(gè)不錯(cuò)的手段。利用頻譜分析將會(huì)迅速的找出對(duì)應(yīng)的和弦和音符并在新的樂器上演奏出來。事實(shí)上傳統(tǒng)的處理方法提供了一系列這樣的手段:通過解碼器與基于本征樂器的樂器歸一化方法或者復(fù)調(diào)方法來實(shí)現(xiàn)。每一種樂器都有獨(dú)特的音符集和時(shí)域瞬態(tài)特征,但困難的是即使對(duì)于單一樂器來說,其頻譜包絡(luò)在不同的音高下并不服從同峰值模式。同時(shí)還有不同的泛音和諧頻需要處理。所有的這些使得音樂在不同樂器間的風(fēng)格轉(zhuǎn)換十分困難。

level-1:深度學(xué)習(xí)專業(yè)的同學(xué)

如果擁有一點(diǎn)樂理基礎(chǔ)的話,可以使用CNN模型通過MIDI格式的音樂生成的label來學(xué)習(xí)音樂的表達(dá)和轉(zhuǎn)錄。MIDI是一種在合成器中常用的數(shù)字音樂,每一個(gè)鍵被按下或者抬起都意味著一次事件的觸發(fā)??梢酝ㄟ^如MAPS一樣的數(shù)據(jù)集來實(shí)現(xiàn)復(fù)調(diào)鋼琴音樂的轉(zhuǎn)錄問題。

level-2:NLP學(xué)者將如何處理呢?

NLP學(xué)者最有可能使用的方法應(yīng)該是sequence to sequence模型了,但這種方法需要同時(shí)追蹤原始樂器和目標(biāo)樂器的發(fā)音序列。

level-3:直接學(xué)習(xí)轉(zhuǎn)換和鄰域歸一化

對(duì)于十分優(yōu)秀的音樂家來說,他們會(huì)明白每一種樂器之間的細(xì)微差別是MIDI所不能捕捉到的,而這個(gè)問題就是facebook文章中的創(chuàng)新所在。研究人員借鑒了wavenet的自回歸架構(gòu)并充分利用它將這一問題轉(zhuǎn)換為了“下一個(gè)音符是什么”的類似問題,從而將其變成了一個(gè)非監(jiān)督問題來解決。

wavenet本質(zhì)上使用隨學(xué)習(xí)過程不斷擴(kuò)大的卷積得到了增加的感受野,從而可以得到更好的預(yù)測(cè)結(jié)果和包含更為豐富特征的隱含空間。這些特征抓住了人類聲音和樂器聲音的本質(zhì),就像cnn中抽取的圖像特征一樣。此時(shí)如果你想要通過學(xué)習(xí)一個(gè)自回歸模型來預(yù)測(cè)鋼琴的下一個(gè)音調(diào),你只需要簡(jiǎn)單的學(xué)習(xí)一對(duì)兒wavenet編碼器和解碼器。編碼器將把原始的音樂序列投射到隱含空間中,而解碼器將盡力理解隱含空間的中的數(shù)值并解碼成下序列的下一個(gè)值。

是不是很奇妙?如果一個(gè)模型可以編碼鋼琴但解碼成其他樂器是不是就可以實(shí)現(xiàn)音樂在不同樂器間的轉(zhuǎn)換啦?這就是FacebookAI研究人員的努力。他們利用一個(gè)相同的編碼器對(duì)多種樂器進(jìn)行編碼,而后利用不同的解碼器實(shí)現(xiàn)不同樂器的解碼,實(shí)現(xiàn)了多種樂器之間的風(fēng)格互轉(zhuǎn)。那么它是如何工作的呢?下面讓我我們來具體看一看。

多個(gè)樂器間共享同一個(gè)解碼器會(huì)迫使這個(gè)解碼器去學(xué)習(xí)音樂間的相同特征。但對(duì)于解碼器來說,我們需要告訴它這到底是什么樂器,需要解碼的目標(biāo)域是什么。這就需要對(duì)于不同樂器的域訓(xùn)練特殊的解碼器來實(shí)現(xiàn)。論文中使用了對(duì)抗的方法來實(shí)現(xiàn)這一目標(biāo)。由于通用的潛在空間希望去尋找通用的特征而忽略了每種樂器的特殊性,而混淆矩陣則希望分割共同特征中不同的表達(dá)并盡可能的實(shí)現(xiàn)不同的類別特征。通過特殊與一般之間的對(duì)抗得到了兩個(gè)性能強(qiáng)大的編碼和解碼模型。值得注意的是要想同時(shí)獲得兩個(gè)性能優(yōu)異的編解碼模型,需要仔細(xì)地選擇正則化系數(shù)來實(shí)現(xiàn)。

讓我們來看看這個(gè)模型的損失函數(shù)。具體的訓(xùn)練過程是這樣的,首先在不同樂器的域中選取一個(gè)樣本sj,隨后利用隨機(jī)變調(diào)來避免模型無腦地對(duì)數(shù)據(jù)進(jìn)行記憶。論文中對(duì)0.25-0.5s長(zhǎng)的樣本使用了-0.5-0.5的半步變調(diào),可以用O(sj,r)來表示,其中r是隨機(jī)種子。你也許會(huì)對(duì)這一步感到疑惑,但使用過谷歌magenta模型或者瞬時(shí)生成模型的人都會(huì)有這樣的經(jīng)歷,有的時(shí)候模型會(huì)像鸚鵡學(xué)舌一樣簡(jiǎn)單的重復(fù)記憶下的序列,簡(jiǎn)直是公然的過擬合了。而這就是數(shù)據(jù)增強(qiáng)和偏移過程的關(guān)鍵所在,也是訓(xùn)練多種樂器的編碼器關(guān)鍵所在。

隨后增強(qiáng)數(shù)據(jù)通過wavenet編碼器中擴(kuò)大的卷積層轉(zhuǎn)換到了隱含空間中,并通過對(duì)應(yīng)的解碼器Dj還原到了其對(duì)應(yīng)的樂器空間中并預(yù)測(cè)出了下一個(gè)音符輸出。研究人員通過交叉熵比較實(shí)際的下一個(gè)輸出和預(yù)測(cè)的下一個(gè)輸出來計(jì)算損失函數(shù)。其中第一項(xiàng)代表重建誤差要盡可能的小,而第二項(xiàng)領(lǐng)域分類的誤差則用于盡可能的分開不同域的特征,這也是網(wǎng)絡(luò)進(jìn)行對(duì)抗訓(xùn)練的表現(xiàn)。作為一個(gè)對(duì)抗模型,一個(gè)監(jiān)督的正則項(xiàng)通過后編碼的特征矢量用于預(yù)測(cè)不同的域。它被稱為域混淆網(wǎng)絡(luò)(Domain Confusion Network)。

網(wǎng)絡(luò)在實(shí)際工作過程中,輸入的一個(gè)交響樂片段會(huì)被轉(zhuǎn)換和翻譯為一種特殊的樂器,但這個(gè)模型最令人驚嘆的能力還不止于此。當(dāng)輸入一種模型從未見過的樂器時(shí),通過自動(dòng)編碼和解碼過程它依然可以完美的工作!這證明了模型中的編碼器確實(shí)可以提取出音樂中的一般化特征并在隱含空間中表示出來,及時(shí)沒有見過這個(gè)樂器。這是很多生成算法的核心概念,像GANs和變分自編碼都利用這一思想創(chuàng)造了很多迷人的工作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    56761
  • 傅里葉變換
    +關(guān)注

    關(guān)注

    6

    文章

    443

    瀏覽量

    43151
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122795

原文標(biāo)題:深度解析Facebook的音樂轉(zhuǎn)換AI模型

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?688次閱讀
    使用MATLAB進(jìn)行無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    監(jiān)督學(xué)習(xí)-Hierarchical clustering 層次聚類python的實(shí)現(xiàn)

    【深度學(xué)習(xí)基礎(chǔ)-17】監(jiān)督學(xué)習(xí)-Hierarchical clustering 層次聚類-python實(shí)現(xiàn)
    發(fā)表于 04-28 10:07

    如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類問題?

    人工智能下面有哪些機(jī)器學(xué)習(xí)分支?如何用卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法去解決機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問題?
    發(fā)表于 06-16 08:09

    基于半監(jiān)督學(xué)習(xí)的跌倒檢測(cè)系統(tǒng)設(shè)計(jì)_李仲年

    基于半監(jiān)督學(xué)習(xí)的跌倒檢測(cè)系統(tǒng)設(shè)計(jì)_李仲年
    發(fā)表于 03-19 19:11 ?4次下載

    基于半監(jiān)督學(xué)習(xí)框架的識(shí)別算法

    人體行為識(shí)別是計(jì)算機(jī)視覺研究的熱點(diǎn)問題,現(xiàn)有的行為識(shí)別方法都是基于監(jiān)督學(xué)習(xí)框架.為了取得較好的識(shí)別效果,通常需要大量的有標(biāo)記樣本來建模.然而,獲取有標(biāo)記樣本是一個(gè)費(fèi)時(shí)又費(fèi)力的工作.為了解決這個(gè)
    發(fā)表于 01-21 10:41 ?1次下載

    英偉達(dá)通過利用GAN及無監(jiān)督學(xué)習(xí)實(shí)現(xiàn)場(chǎng)景的四季轉(zhuǎn)換

    英偉達(dá)近期在GAN相關(guān)研究和應(yīng)用方面進(jìn)展迅猛,在前一陣的成果展示中,通過利用生成對(duì)抗網(wǎng)絡(luò)(GAN)及無監(jiān)督學(xué)習(xí)兩種深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)場(chǎng)景
    發(fā)表于 05-16 15:55 ?2659次閱讀

    你想要的機(jī)器學(xué)習(xí)課程筆記在這:主要討論監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)

    with experience E(一個(gè)程序從經(jīng)驗(yàn)E中學(xué)習(xí)解決任務(wù)T進(jìn)行某一任務(wù)量度P,通過P測(cè)量在T的表現(xiàn)而提高經(jīng)驗(yàn)E(另一種定義:機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。) 不同類型的機(jī)器學(xué)習(xí)算法:主要
    發(fā)表于 12-03 17:12 ?730次閱讀

    如何用Python進(jìn)行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)是一種用于在數(shù)據(jù)中查找模式的機(jī)器學(xué)習(xí)技術(shù)。無監(jiān)督算法給出的數(shù)據(jù)不帶標(biāo)記,只給出輸入變量(X),沒有相應(yīng)的輸出變量。在無監(jiān)督學(xué)習(xí)中,算法自己去發(fā)現(xiàn)數(shù)據(jù)中有趣的結(jié)構(gòu)。
    的頭像 發(fā)表于 01-21 17:23 ?4673次閱讀

    機(jī)器學(xué)習(xí)算法中有監(jiān)督和無監(jiān)督學(xué)習(xí)的區(qū)別

    監(jiān)督學(xué)習(xí)的好處之一是,它不需要監(jiān)督學(xué)習(xí)必須經(jīng)歷的費(fèi)力的數(shù)據(jù)標(biāo)記過程。但是,要權(quán)衡的是,評(píng)估其性能的有效性也非常困難。相反,通過將監(jiān)督學(xué)習(xí)算法的輸出與測(cè)試數(shù)據(jù)的實(shí)際標(biāo)簽進(jìn)行比較,可以很容易地衡量
    的頭像 發(fā)表于 07-07 10:18 ?6110次閱讀

    最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

    導(dǎo)讀 最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家一個(gè)感性的認(rèn)識(shí)。 半監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從一個(gè)小的帶標(biāo)簽的數(shù)據(jù)集和相對(duì)較大的未帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)得到的。SSL的目標(biāo)是
    的頭像 發(fā)表于 11-02 16:08 ?2956次閱讀

    監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個(gè)概念

    有趣的方法,用來解決機(jī)器學(xué)習(xí)中缺少標(biāo)簽數(shù)據(jù)的問題。SSL利用未標(biāo)記的數(shù)據(jù)和標(biāo)記的數(shù)據(jù)集來學(xué)習(xí)任務(wù)。SSL的目標(biāo)是得到比單獨(dú)使用標(biāo)記數(shù)據(jù)訓(xùn)練的監(jiān)督學(xué)習(xí)模型更好的結(jié)果。這是關(guān)于半
    的頭像 發(fā)表于 11-02 16:14 ?3290次閱讀
    半<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>最基礎(chǔ)的3個(gè)概念

    為什么半監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來?

    揭示添加無監(jiān)督數(shù)據(jù)可以提高模型泛化和性能。事實(shí)上,在非常多的場(chǎng)景中,帶有標(biāo)簽的數(shù)據(jù)并不容易獲得。半監(jiān)督學(xué)習(xí)可以在標(biāo)準(zhǔn)的任務(wù)中實(shí)現(xiàn)SOTA的效果,只需要一小部分的有標(biāo)記數(shù)據(jù) 數(shù)百個(gè)訓(xùn)練
    的頭像 發(fā)表于 11-27 10:42 ?4150次閱讀

    監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好

    監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開始,無數(shù)的算法,從簡(jiǎn)單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來提高精...
    的頭像 發(fā)表于 12-08 23:32 ?1716次閱讀

    機(jī)器學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域

    監(jiān)督學(xué)習(xí)|機(jī)器學(xué)習(xí)| 集成學(xué)習(xí)|進(jìn)化計(jì)算| 監(jiān)督學(xué)習(xí)| 半監(jiān)督學(xué)習(xí)| 自
    發(fā)表于 01-20 10:52 ?5261次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>中的無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>應(yīng)用在哪些領(lǐng)域

    監(jiān)督學(xué)習(xí)的一些思考

    監(jiān)督學(xué)習(xí)的流行是勢(shì)在必然的。在各種主流有監(jiān)督學(xué)習(xí)任務(wù)都做到很成熟之后,數(shù)據(jù)成了最重要的瓶頸。從無標(biāo)注數(shù)據(jù)中學(xué)習(xí)有效信息一直是...
    發(fā)表于 01-26 18:50 ?1次下載
    自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的一些思考