一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓音樂(lè)更柔和 MIT用AI過(guò)濾音源

jmiy_worldofai ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-07-11 17:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一般利用均衡器可以將音樂(lè)中的低音部分調(diào)出來(lái),但是麻省理工學(xué)院的計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(Computer Science and Artificial Intelligence Lab,CSAIL)的研究人員發(fā)現(xiàn)了更好的解決方案。他們所研發(fā)的新系統(tǒng) PixelPlayer,能夠利用人工智能來(lái)區(qū)分和過(guò)濾聲音,讓音樂(lè)聽(tīng)起來(lái)更洪亮或更柔和。

將指定視頻錄入經(jīng)過(guò)充分訓(xùn)練的 PixelPlayer,系統(tǒng)隨機(jī)能夠過(guò)濾伴奏,同時(shí)識(shí)別音源,接著計(jì)算圖像中每個(gè)像素的音量,然后通過(guò)“空間定位”確定產(chǎn)生相似音波的片段。

今年9月,德國(guó)慕尼黑即將舉行歐洲計(jì)算機(jī)視覺(jué)會(huì)議(European Conference on Computer Vision),會(huì)議中要發(fā)表的一篇新論文則詳細(xì)論述了“像素的聲音(The Sound of Pixels)”。麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室的博士生,同時(shí)也是這篇論文的合著者 Zhao Hang 同學(xué)表示,“最好的情況就是,我們能識(shí)別出哪種樂(lè)器發(fā)出怎樣的聲音?!?/p>

PixelPlayer 的核心是一種基于樂(lè)器組合多模態(tài)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)集采用了 Youtube 上 714 條未經(jīng)修剪且未經(jīng)標(biāo)記的視頻。其中,總時(shí)長(zhǎng)為 60 小時(shí)的 500 條視頻用于訓(xùn)練,剩余的則用于驗(yàn)證和測(cè)試。在訓(xùn)練過(guò)程中,研究人員分別根據(jù)原聲吉他、大提琴、單簧管、長(zhǎng)笛和其他樂(lè)器向系統(tǒng)饋入了算法。

這只是 PixelPlayer 多重機(jī)器學(xué)習(xí)框架的一個(gè)部分。經(jīng)過(guò)訓(xùn)練后的視頻分析算法將從剪輯幀中提取出視覺(jué)特征,這就是系統(tǒng)的第二個(gè)神經(jīng)網(wǎng)絡(luò),即音頻分析網(wǎng)絡(luò)。音頻分析網(wǎng)絡(luò)將聲音拆分為片段,并從中提取特征。最后,音頻合成網(wǎng)絡(luò)將把上述兩個(gè)網(wǎng)絡(luò)輸出的特定像素和聲波關(guān)聯(lián)起來(lái)。

PixelPlayer 進(jìn)行完全自監(jiān)督的學(xué)習(xí),人們無(wú)需對(duì)數(shù)據(jù)注釋,而且系統(tǒng)目前已經(jīng)能識(shí)別 20 種樂(lè)器。Zhao Hang 說(shuō),較大的數(shù)據(jù)集增強(qiáng)了系統(tǒng)的識(shí)別量,但識(shí)別樂(lè)器子類的能力卻不佳。系統(tǒng)也可以識(shí)別音樂(lè)元素,例如小提琴的諧波頻率。

研究人員認(rèn)為 PixelPlayer 可以進(jìn)行聲音剪輯,或者幫助機(jī)器人理解動(dòng)物、車(chē)輛和其他物體所制造的環(huán)境聲音。他們寫(xiě)到,“我們希望我們的工作能夠開(kāi)辟新的研究途徑,從視覺(jué)和聽(tīng)覺(jué)信號(hào)角度實(shí)現(xiàn)聲源分離”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103622
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279947
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    254

    瀏覽量

    24427

原文標(biāo)題:MIT實(shí)現(xiàn)用AI過(guò)濾音源 讓音樂(lè)更悅耳

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    聯(lián)想,AI計(jì)算發(fā)生“鐘擺革命”

    AI基礎(chǔ)設(shè)施革新,智能化越過(guò)山丘
    的頭像 發(fā)表于 05-15 19:12 ?1417次閱讀
    聯(lián)想,<b class='flag-5'>讓</b><b class='flag-5'>AI</b>計(jì)算發(fā)生“鐘擺革命”

    KSC XA輕觸開(kāi)關(guān)提供聲音柔和的輕觸反饋,增強(qiáng)用戶體驗(yàn)

    :LFUS)是一家多元化的工業(yè)技術(shù)制造公司,致力于為可持續(xù)發(fā)展、互聯(lián)互通和安全的世界提供動(dòng)力。公司今日隆重推出? KSC XA 系列柔和聲音輕觸開(kāi)關(guān) ?,為需要安靜、可靠觸覺(jué)反饋的應(yīng)用提供了一項(xiàng)關(guān)鍵解決方案。KSC XA開(kāi)關(guān)專為表面貼裝技術(shù)(SMT)應(yīng)用而設(shè)計(jì),提供創(chuàng)新
    發(fā)表于 04-23 16:20 ?795次閱讀
     KSC XA輕觸開(kāi)關(guān)提供聲音<b class='flag-5'>柔和</b>的輕觸反饋,增強(qiáng)用戶體驗(yàn)

    音響EMC電磁兼容性測(cè)試整改:音樂(lè)之旅不受電磁干擾

    南柯電子|音響EMC電磁兼容性測(cè)試整改:音樂(lè)之旅不受電磁干擾
    的頭像 發(fā)表于 04-21 11:17 ?417次閱讀
    音響EMC電磁兼容性測(cè)試整改:<b class='flag-5'>讓</b><b class='flag-5'>音樂(lè)</b>之旅不受電磁干擾

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件端側(cè)AI模型接入得心應(yīng)手

    Studio提供了最優(yōu)解。Neuron Studio可針對(duì)模型到應(yīng)用,提供一站式、全鏈路、自動(dòng)化的開(kāi)發(fā)協(xié)助,不僅AI應(yīng)用開(kāi)發(fā)的全流程可視化,帶來(lái)整個(gè)多種工具的一站式開(kāi)發(fā)能力,還支持神經(jīng)網(wǎng)絡(luò)自動(dòng)化調(diào)優(yōu)和跨
    發(fā)表于 04-13 19:52

    愛(ài)立信如何網(wǎng)絡(luò)運(yùn)維簡(jiǎn)單

    在愛(ài)立信“可編程網(wǎng)絡(luò)”這一創(chuàng)新概念里,差異化連接、AI賦能和意圖驅(qū)動(dòng)、網(wǎng)絡(luò)能力開(kāi)放作為三大基石,各司其職,網(wǎng)絡(luò)智能、更靈活、開(kāi)放。本期《信觀察》,愛(ài)立信專家將從
    的頭像 發(fā)表于 03-03 09:27 ?9820次閱讀

    AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀體驗(yàn)--跟著迪哥學(xué)Agent

    的知識(shí)是自由行,那么閱讀《Agent》就是跟團(tuán)游。它我對(duì)AI落地應(yīng)用有了系統(tǒng)和清晰的了解。 《Agent》第一章是全書(shū)的導(dǎo)引章節(jié),本章我對(duì)Agent的理解從模糊到清晰,然后逐一介
    發(fā)表于 03-02 12:28

    如何您的空氣過(guò)濾系統(tǒng)具備未來(lái)適應(yīng)性

    空氣過(guò)濾是近些年來(lái)持續(xù)熱門(mén)的話題,與公眾息息相關(guān)的比如從PM10和PM2.5顆粒物過(guò)濾,到COVID-19期間的病毒過(guò)濾,空氣過(guò)濾在保護(hù)公眾健康方面的重要性越來(lái)越高,尤其是在封閉空間內(nèi)
    的頭像 發(fā)表于 01-24 10:46 ?539次閱讀

    CAN協(xié)議的軟件過(guò)濾和硬件過(guò)濾

    CAN過(guò)濾是控制器局域網(wǎng)絡(luò)中用于控制哪些消息可以被節(jié)點(diǎn)接收的一種機(jī)制。在CAN網(wǎng)絡(luò)中,由于是CAN總線通信,所有節(jié)點(diǎn)都會(huì)接收到網(wǎng)絡(luò)上的所有消息。為了提高效率和減少處理無(wú)關(guān)數(shù)據(jù)的負(fù)擔(dān),節(jié)點(diǎn)可以配置
    的頭像 發(fā)表于 12-26 19:33 ?695次閱讀
    CAN協(xié)議的軟件<b class='flag-5'>過(guò)濾</b>和硬件<b class='flag-5'>過(guò)濾</b>

    AI項(xiàng)目管理平臺(tái)怎么

    AI項(xiàng)目管理平臺(tái)是一種集成了項(xiàng)目管理工具、AI開(kāi)發(fā)環(huán)境和數(shù)據(jù)分析能力的綜合性平臺(tái)。接下來(lái),AI部落小編為您梳理AI項(xiàng)目管理平臺(tái)怎么。
    的頭像 發(fā)表于 11-13 09:38 ?671次閱讀

    TPA3110D2音頻板開(kāi)關(guān)電源+12V供電,上電后音源還沒(méi)輸出就有噪聲,怎么解決?

    TPA3110D2音頻板開(kāi)關(guān)電源+12V供電,上電后音源還沒(méi)輸出就有噪聲, 請(qǐng)問(wèn)電源不換的情況下,在音頻板上增加什么電路可以解決噪聲?
    發(fā)表于 11-04 08:20

    使用TPA3116做了一個(gè)D類功放板,在無(wú)音源輸入時(shí)耳朵貼近喇叭有很明顯的電流噪聲怎么解決?

    我使用TPA3116做了一個(gè)D類功放板,播放音樂(lè)正常,只是在無(wú)音源輸入時(shí)耳朵貼近喇叭有很明顯的電流噪聲。 測(cè)試: (1)將前級(jí)放大的輸出與TPA3116的輸入斷開(kāi),同時(shí)將TPA3116的輸入接地
    發(fā)表于 10-28 06:04

    TPA3110功放一接上音源就保護(hù),為什么?

    TPA3110做的功放板,客戶退了幾個(gè)壞板子回來(lái) 實(shí)測(cè)大部分都是左聲道輸入端的耦合電容(1uf)損壞,一接音源就進(jìn)入保護(hù) 還有一個(gè)是耦合電容正常,但也是一接音源就進(jìn)入保護(hù) 還有一個(gè)播放
    發(fā)表于 10-24 08:27

    TAS5805M是否支持mono音頻格式的音源?

    1、TAS5805M是否支持mono音頻格式的音源?(TAS5805MEVM播放mono格式的掃頻音源沒(méi)有聲音,直接用電腦播放有聲音,示波器量測(cè)data有信號(hào)) 2、若要使TAS
    發(fā)表于 10-16 06:46

    PCM6360-Q1 MIC輸入的音源如何播放?

    我在調(diào)試EVB的時(shí)候如何把MIC入的音源播放出去,目前我是使用示波器觀察的TDM信號(hào),可以通過(guò)模擬或者USB的方式把錄入的音源播放出來(lái)么?用來(lái)確認(rèn)輸入和輸出的音源匹配 謝謝
    發(fā)表于 09-30 08:03

    昆侖萬(wàn)維發(fā)布全球首個(gè)AI流媒體音樂(lè)平臺(tái)Melodio

    昆侖萬(wàn)維在科技創(chuàng)新領(lǐng)域再次邁出重要一步,正式推出了全球首個(gè)AI流媒體音樂(lè)平臺(tái)——Melodio,以及配套的AI音樂(lè)商用創(chuàng)作平臺(tái)Mureka。這兩款創(chuàng)新產(chǎn)品的問(wèn)世,標(biāo)志著
    的頭像 發(fā)表于 08-14 17:44 ?1166次閱讀