一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個可以預(yù)測活頁樂譜中和目標(biāo)錄音匹配度最高的的位置的AI系統(tǒng)

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-12-07 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

音樂AI技術(shù)正在快速發(fā)展。

在預(yù)印平臺Arxiv.org上發(fā)布的一項研究中,約翰內(nèi)斯·開普勒大學(xué)林茨計算感知研究所和奧地利人工智能研究所的研究人員介紹了一個可以預(yù)測活頁樂譜中和目標(biāo)錄音匹配度最高的的位置的AI系統(tǒng)。表面上,其對齊精度高于當(dāng)前基于圖像的最新樂譜追蹤器。

樂譜追蹤技術(shù)是很多應(yīng)用程序的基礎(chǔ)。這些應(yīng)用包括自動伴奏、翻頁以及將現(xiàn)場表演與可視化圖像同步等等?,F(xiàn)有的系統(tǒng)要么依賴于固定長短的小片段樂譜圖像,要么需要光學(xué)音樂識別技術(shù)所提取出的計算機(jī)可讀的樂譜。但是這些研究人員的AI系統(tǒng)可以以獨特的方式觀察整頁樂譜,從而從頭到尾地追蹤任意長度的音樂表演。

這個研究團(tuán)隊將樂譜追蹤當(dāng)作一種圖像分割任務(wù)。根據(jù)特定時間的某個音樂表演,他們的系統(tǒng)針對當(dāng)前正在播放的音樂相對應(yīng)的樂譜預(yù)測分段蒙版(即小片段)。研究人員說,僅僅利用固定大小音頻輸入的樂譜追蹤器無法在超過特定環(huán)境的情況下區(qū)分重復(fù)的音符,然而他們提出的AI系統(tǒng)在處理較長時間的樂譜時都不會有問題。

在實驗過程中,研究人員們從多模型樂譜數(shù)據(jù)集(MSMD)中獲取了一些復(fù)音鋼琴樣本,其中包括巴赫、莫扎特、貝多芬等多個作曲家的作品。在手動識別并且糾正一些對齊上的錯誤后,他們通過353對樂譜和MIDI音頻信息訓(xùn)練了AI系統(tǒng)。

該AI系統(tǒng)的另一位作者說,除了最高的門檻以外(沒搞懂highest threshold是啥),他們的系統(tǒng)擁有比基準(zhǔn)線更高的性能,并能在時間差方面得出更精確的結(jié)果(即對于更嚴(yán)格的容錯率,百分比更高)。它偶爾也會產(chǎn)生一些錯誤,研究人員將其歸因于系統(tǒng)可能會在圖像紙上 “大幅跳躍”。但是他們斷言,種種試驗結(jié)果都表明這個AI系統(tǒng)在大多數(shù)情況下都是“非常精確的”。

“未來的工作會需要對掃描圖像或照片進(jìn)行測試,以評估該AI系統(tǒng)在視覺領(lǐng)域的泛化能力。”研究人員寫道,“成就功能更強(qiáng)大的系統(tǒng)的下一步是顯式或隱式地結(jié)合某種機(jī)制來處理樂譜和演奏中重復(fù)的音符。盡管我們也懷疑其性能會很大程度上取決于迄今為止音頻的隱式編碼。舉例來說,循環(huán)網(wǎng)絡(luò)中能夠存儲多大的聽覺環(huán)境將成為很重要的一個因素,但我們相信,我們所提出的方法能夠從合適的(經(jīng)受過訓(xùn)練的)的數(shù)據(jù)中很自然地獲得這種功能?!?/p>

音樂AI技術(shù)正在快速發(fā)展。OpenAI最近發(fā)布了一款叫做Jukebox的機(jī)器學(xué)習(xí)框架,它可以生成包括基本歌曲在內(nèi)的音樂作為各種音樂類型和音樂風(fēng)格的原始音頻。在2018年末,Google Brain的“Project Magenta”項目致力于“探索機(jī)器學(xué)習(xí)在創(chuàng)作過程中的作用”,提出了一個叫做“Musical Transformer”的模型。該模型能夠生成可識別的重復(fù)性歌曲。不僅如此,去年三月,谷歌發(fā)布了一種算法“Google Doodle”,讓用戶能夠創(chuàng)造向巴赫致敬的旋律。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    3031

    瀏覽量

    83287
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25377
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1308

    瀏覽量

    25101

原文標(biāo)題:研究人員的AI技術(shù)能夠?qū)崟r匹配活頁樂譜與MIDI音頻

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于LockAI視覺識別模塊:C++多模板匹配

    多模板匹配種在圖像中同時尋找多個模板的技術(shù)。通過對每個模板逐進(jìn)行匹配,找到與輸入圖像最相似的區(qū)域,并標(biāo)記出匹配
    發(fā)表于 05-14 15:00

    基于LockAI視覺識別模塊:C++多模板匹配

    多模板匹配種在圖像中同時尋找多個模板的技術(shù)。通過對每個模板逐進(jìn)行匹配,找到與輸入圖像最相似的區(qū)域,并標(biāo)記出匹配
    的頭像 發(fā)表于 05-14 14:37 ?280次閱讀
    基于LockAI視覺識別模塊:C++多模板<b class='flag-5'>匹配</b>

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+Agent的工作原理及特點

    感知系統(tǒng)從環(huán)境中收集信息并從中提取相關(guān)知識的能力,這類包括文本、圖像、聲音等。 2)規(guī)劃 規(guī)劃是指Agent為了實現(xiàn)某一目標(biāo)而進(jìn)行的決策過程,在該階段Agent會根據(jù)收集的信息制定出系列策略,并確定
    發(fā)表于 05-11 10:24

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    生態(tài)系統(tǒng)系統(tǒng)性革新,更需要高效、強(qiáng)力的開發(fā)者解決方案。為此,聯(lián)發(fā)科帶來了站式可視化智能開發(fā)工具——天璣開發(fā)工具集,包含AI應(yīng)用全流程開發(fā)工具Neuron Studio,并帶來全新升
    發(fā)表于 04-13 19:52

    無人機(jī)低延時目標(biāo)跟蹤識別智算系統(tǒng)

    ,實現(xiàn)末端自主AI精準(zhǔn)目標(biāo)識別、目標(biāo)追蹤,同時兼具時敏性高、成本低、功耗低等特色,具備滿足裝備復(fù)雜環(huán)境要求下,軟硬件自主可控的能力。本產(chǎn)品包含AI智能硬件、
    發(fā)表于 03-06 15:48

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    功能模塊,如AI引擎、可變精度DSP。 ? 靈活性:FPGA可以系統(tǒng)運(yùn)行中重新編程,實現(xiàn)功能的動態(tài)重構(gòu)。 ? 低功耗:與ASIC相比,F(xiàn)PGA在功耗方面具有優(yōu)勢,尤其是在處理低延遲任務(wù)時。 二
    發(fā)表于 03-03 11:21

    AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得2——客服機(jī)器人、AutoGen框架 、生成式代理

    及時處理。 第5章的斯坦福AI小鎮(zhèn)項目對生成式代理技術(shù)做出了開創(chuàng)性的探索。該項目的核心是將LLM與計算交互代理相結(jié)合,構(gòu)建了具有記憶、反思、規(guī)劃能力的智能體系統(tǒng)。在技術(shù)實現(xiàn)層面,記
    發(fā)表于 02-25 21:59

    電位對中和反應(yīng)的影響

    電位對中和反應(yīng)具有顯著的影響,主要體現(xiàn)在以下幾個方面: 、驅(qū)動電子轉(zhuǎn)移 在酸堿中和反應(yīng)中,電子的轉(zhuǎn)移是由電位差驅(qū)動的。電位是反映電化學(xué)
    的頭像 發(fā)表于 12-28 14:10 ?634次閱讀

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    的是百的Picodet模型,它是種基于深度卷積網(wǎng)絡(luò)(DNN)的輕量級目標(biāo)檢測模型,具有非常高的檢測精度,可以在低算力設(shè)備進(jìn)行實時的端到端推理檢測。 2.1 Picodet模型介紹
    發(fā)表于 12-19 14:33

    2025年1000億!Arm立了目標(biāo)!

    立下的目標(biāo):到2025年底,全球?qū)⒂谐^1,000億臺具備AI能力的Arm設(shè)備。這個1000億目標(biāo)
    的頭像 發(fā)表于 12-17 16:43 ?891次閱讀
    2025年1000億!Arm立了<b class='flag-5'>一</b><b class='flag-5'>個</b>小<b class='flag-5'>目標(biāo)</b>!

    錄音筆芯片方案:NVF04M-SOP16高品質(zhì)錄音IC,捕捉每一個音節(jié)

    概述錄音筆從最初的模擬錄音,到如今的數(shù)字高清錄音,再到集高清錄音、錄音轉(zhuǎn)文字、同聲傳譯、云端存儲等功能于
    的頭像 發(fā)表于 10-25 16:07 ?801次閱讀
    <b class='flag-5'>錄音</b>筆芯片方案:NVF04M-SOP16高品質(zhì)<b class='flag-5'>錄音</b>IC,捕捉每<b class='flag-5'>一個</b>音節(jié)

    中華電信攜手愛立信技術(shù),共推碳中和目標(biāo)

    10月17日,中國臺灣地區(qū)的主要電信運(yùn)營商中華電信宣布,將引入愛立信的最新5G技術(shù),以加速實現(xiàn)凈零排放(即碳中和目標(biāo)。   據(jù)悉,中華電信近日已通過SBTi驗證,承諾在2045年實現(xiàn)凈零排放,這比全球普遍設(shè)定的2050年凈零目標(biāo)
    的頭像 發(fā)表于 10-17 16:48 ?1000次閱讀

    請問同塊芯片上的兩THS3202級間需要匹配嗎?

    上的傳輸線匹配嗎?在頻率比較低的時候認(rèn)為是短線條件下,可以直接把第一個運(yùn)放輸出加到第二級輸入嗎? 另外電流運(yùn)放的ft由Rf決定,那么只要綜合下選擇Rf使得沒有頻響過沖是不是意味著相位
    發(fā)表于 09-13 07:50

    物聯(lián)網(wǎng)如何助力實現(xiàn)碳中和

    碳達(dá)峰碳中和“1+N”政策體系的構(gòu)建實施推動下,更多企業(yè)高管們專注于企業(yè)可持續(xù)發(fā)展管理并設(shè)定目標(biāo),實現(xiàn)碳中和意味著公司從大氣中清除的碳排放量至少與其產(chǎn)生的碳排放量相同。些企業(yè)通過物聯(lián)
    的頭像 發(fā)表于 09-06 09:51 ?1080次閱讀

    電磁軌跡預(yù)測分析系統(tǒng)設(shè)計方案

    智慧華盛恒輝電磁軌跡預(yù)測分析系統(tǒng)的設(shè)計方案是綜合性的項目,它結(jié)合了電磁學(xué)、運(yùn)動學(xué)、數(shù)據(jù)分析以及可能的人工智能或機(jī)器學(xué)習(xí)技術(shù),以實現(xiàn)對電磁運(yùn)動軌跡的精確
    的頭像 發(fā)表于 07-15 16:22 ?766次閱讀