一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

比MP3小10倍,Meta公開全新音頻壓縮技術

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 作者:OSC開源社區(qū) ? 2022-11-07 11:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Meta 近日在一篇題為 “High Fidelity Neural Audio Compression”(高保真神經(jīng)音頻壓縮)的論文中公布了一項名為 "EnCodec" 的開源音頻壓縮技術,該技術由 AI 驅(qū)動,可以在音頻質(zhì)量沒有損失的前提下,將音頻壓縮到比 MP3 格式還要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 將這項技術的實現(xiàn)方法分成了一個由三部分組成的系統(tǒng),經(jīng)過訓練后的 AI 可以將音頻壓縮到所需的目標大小,其實現(xiàn)過程如下:

首先,編碼器將未壓縮的數(shù)據(jù)轉(zhuǎn)換為較低幀率的 "latent space" 表示(representation);

然后,量化器將這個表示壓縮到目標大小,同時跟蹤最重要的信息,這些信息以后將被用于重建原始信號(這個壓縮信號將通過網(wǎng)絡發(fā)送或保存在磁盤上);

最后,解碼器使用單個 CPU 上的神經(jīng)網(wǎng)絡將壓縮的數(shù)據(jù)實時地轉(zhuǎn)變回音頻;

至于應用,Meta 表示這種由人工智能驅(qū)動的 "超壓縮音頻" 可以在惡劣的網(wǎng)絡條件下獲得更快、更優(yōu)質(zhì)的通話效果。作為一家 “梭哈” 元宇宙的公司,這項技術還可以提供更加豐富的元宇宙體驗(視頻會議、影音流媒體、VR 游戲等),而不需要提高帶寬。 除了語音通話,這項技術同樣可以應用于音樂領域,未來我們有望可以獲得高品質(zhì)、小體積的音頻文件。 目前這項技術仍處于研究階段,源代碼和一些音頻樣本都已公開在 GitHub 上:https://github.com/facebookresearch/encodec

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1806

    文章

    49019

    瀏覽量

    249472
  • Meta
    +關注

    關注

    0

    文章

    303

    瀏覽量

    11862

原文標題:比MP3小10倍,Meta公開全新音頻壓縮技術

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    新品|Unit AudioPlayer,支持 MP3/WAV 播放的音頻播放單元

    UnitAudioPlayer是一款自帶MP3解碼功能的音頻播放單元,內(nèi)置高性能音頻解碼芯片N9301,自帶microSD卡座。該產(chǎn)品采用UART通信接口,用戶可通過配置指令實現(xiàn)音頻
    的頭像 發(fā)表于 06-20 15:59 ?321次閱讀
    新品|Unit AudioPlayer,支持 <b class='flag-5'>MP3</b>/WAV 播放的<b class='flag-5'>音頻</b>播放單元

    請問k230如何讀取sd卡并播放其中的mp3音頻,他有庫支持嗎?

    k230如何讀取sd卡并播放其中的mp3音頻,他有庫支持嗎?
    發(fā)表于 06-04 06:24

    芯資訊|廣州唯創(chuàng)電子語音芯片U盤MP3播放IC技術解析與應用指南

    ,在語音芯片領域積累了深厚的技術實力。唯創(chuàng)電子的核心創(chuàng)新之一是其支持U盤直讀的MP3語音芯片系列,這些芯片解決了傳統(tǒng)語音芯片需要專用工具更新語音內(nèi)容的痛點,為用戶提
    的頭像 發(fā)表于 05-30 09:17 ?215次閱讀
    芯資訊|廣州唯創(chuàng)電子語音芯片U盤<b class='flag-5'>MP3</b>播放IC<b class='flag-5'>技術</b>解析與應用指南

    芯資訊|廣州唯創(chuàng)電子MP3語音芯片IC的音頻解碼方式解析

    格式支持、技術特性及應用場景三方面,解析其解碼方案的設計邏輯與優(yōu)勢。一、音頻解碼格式的支持MP3播放類芯片的主流解碼能力唯創(chuàng)電子的MP3語音芯片(如WT2003H系列)
    的頭像 發(fā)表于 05-28 08:48 ?171次閱讀
    芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>MP3</b>語音芯片IC的<b class='flag-5'>音頻</b>解碼方式解析

    KT142C語音芯片支持的語音文件格式什么?Mp3還是wav呢?

    真沒有必要 2、如果客戶強烈需要,我們也是可以添加的。但是KT142C內(nèi)置的寶貴可用空間就變少了 3、因為同等音質(zhì)、同等時長的mp3文件,wav文件體積小很多很多。 所以優(yōu)先壓縮
    的頭像 發(fā)表于 02-17 11:07 ?409次閱讀
    KT142C語音芯片支持的語音文件格式什么?<b class='flag-5'>Mp3</b>還是wav呢?

    學習機MP3語音芯片方案:WMV硬解碼芯片,N9301-316

    在當今數(shù)字化時代,學習機已不再僅僅是靜態(tài)的物品。隨著技術的快速發(fā)展和不斷探索創(chuàng)新方法,人們將音樂與互動學習相融合,為兒童創(chuàng)造出更加富有創(chuàng)意和學習機產(chǎn)品。其中,九芯電子N9301系列MP3解碼芯片
    的頭像 發(fā)表于 02-07 18:31 ?401次閱讀
    學習機<b class='flag-5'>MP3</b>語音芯片方案:WMV硬解碼芯片,N9301-316

    KT148A語音芯片一個mp3語音,有辦法分成一段一段的嗎

    第一步:生成語音素材:到這一步,就實現(xiàn)了語音素材的生成,下載下來就是一整個mp3文件 詳見KT148A資料包里面的文檔說明 第二步:將需要的語音素材剪裁 使用的是Adobe
    的頭像 發(fā)表于 01-22 16:11 ?523次閱讀
    KT148A語音芯片一個<b class='flag-5'>mp3</b>語音,有辦法分成一段一段的嗎

    N930X指定曲目播放MP3音樂芯片:提升睡眠儀體驗

    N930X MP3芯片集成硬解碼,支持定制播放、智能定時、低功耗、自主更新,兼容多種控制及音頻格式,提升睡眠儀體驗,滿足高質(zhì)量睡眠追求。
    的頭像 發(fā)表于 12-11 14:29 ?586次閱讀
    N930X指定曲目播放<b class='flag-5'>MP3</b>音樂芯片:提升睡眠儀體驗

    N930X指定曲目播放MP3音樂芯片:提升睡眠儀體驗

    和自然之聲,幫助人們更好地入睡,提高睡眠質(zhì)量。而N930X指定曲目播放MP3音樂芯片,就是這款睡眠儀的核心部件。芯片簡介N930X是一個提供串口的MP3芯片,完美的集
    的頭像 發(fā)表于 12-11 14:25 ?522次閱讀
    N930X指定曲目播放<b class='flag-5'>MP3</b>音樂芯片:提升睡眠儀體驗

    魅族E2 MP3使用手冊(說明書)

    魅族 E2 MP3 操作使用手冊(說明書)
    發(fā)表于 11-12 13:41 ?0次下載

    請問TLV320DAC3120可以用作MP3的解壓芯片嗎?

    TLV320DAC3120項目要求用喇叭播MP3音頻,我選用的方案是MCU+TLV320DAC3120,計劃按以下步驟進行: 1. MCU通過I2C來配置TLV320DAC3120 2. MCU
    發(fā)表于 11-06 06:26

    能在DSP的存儲器上存MP3或其他格式的音頻文件,由DSP讀后控制TLV320AIC23轉(zhuǎn)換成語音?

    我想用TLV320AIC23和DSP做一個音頻系統(tǒng)。我想問一下能在DSP的存儲器上存MP3或其他格式的音頻文件,由DSP讀后控制TLV320AIC23轉(zhuǎn)換成語音?有沒有好的方案推薦謝謝!
    發(fā)表于 11-01 06:45

    請問如何把WAV,MP3格式的音頻文件轉(zhuǎn)化為16位的數(shù)據(jù)IIS格式?

    你好,請問如何把WAV,MP3格式的音頻文件轉(zhuǎn)化為16位的數(shù)據(jù)IIS格式?
    發(fā)表于 10-23 07:24

    九芯電子電子琴語音芯片的無限可能——N930X-S16 MP3解碼芯片

    播放,是置入了音樂芯片,目前流行的高性價比語音芯片N930X音樂芯片;此款芯片是一個提供串口的MP3芯片,完美地集成了MP3、WMV的硬解碼芯片,在音頻壓縮方面有著
    的頭像 發(fā)表于 10-13 08:01 ?836次閱讀
    九芯電子電子琴語音芯片的無限可能——N930X-S16 <b class='flag-5'>MP3</b>解碼芯片

    N9305 MP3語音芯片:外掛FLASH自定義語音播放解決方案

    隨著科技的飛速發(fā)展,語音芯片作為電子產(chǎn)品中的重要組成部分,不斷引入新的特性和功能以滿足市場需求。其中,N9305系列MP3語音芯片支持外掛Flash、U盤、USB下載的功能成為語音芯片領域的一大亮點
    的頭像 發(fā)表于 10-11 08:01 ?815次閱讀
    N9305 <b class='flag-5'>MP3</b>語音芯片:外掛FLASH自定義語音播放解決方案