走向?qū)嵱玫腁I編解碼闡述

-01-

AI編解碼的意義與挑戰(zhàn)

以上是高通總結(jié)的關于AI編解碼優(yōu)勢的一張示意圖。其中相當多的優(yōu)勢來自于端到端優(yōu)化這一特性，它的壓縮率比較好，可以對任意分布的數(shù)據(jù)做專門優(yōu)化，可以針對任意更符合主觀質(zhì)量的、更符合下游任務的損失函數(shù)進行優(yōu)化。

另一方面，由于它是用神經(jīng)網(wǎng)絡實現(xiàn)的，那便可以在人工智能的大潮中進行復用，例如復用各種推理硬件和算法。還有一個好處是權重比較容易更新，傳統(tǒng)編解碼算法在做成硬件后很難進行修改，但對于基于神經(jīng)網(wǎng)絡的AI編解碼算法，它的權重是可以進行修改的，這是一個很大的優(yōu)勢。

接下來介紹個人認為對AI編解碼器較為重要的六個評價維度，第一是率失真性能和主觀質(zhì)量，它主要和壓縮率有關；第二是復雜度，它與延時、計算量和顯存的要求還有功耗、吞吐率等因素有關；第三是跨平臺解碼，在手機、CPU、GPU上互相編解碼不應該出錯；第四是對下游AI任務訓練和推理的影響，對測試或推理的影響類似于現(xiàn)在比較熱門的面向機器視覺的編解碼，在訓練方面大家會比較關注用AI壓縮的數(shù)據(jù)是否會對神經(jīng)網(wǎng)絡的訓練效果產(chǎn)生影響；第五是泛化與特化能力，有時我們希望它可以泛化，使用同一個模型可以壓縮不同數(shù)據(jù)，有時我們希望它可以特異化，例如在壓縮遙感或者醫(yī)學類數(shù)據(jù)時，可以構造專門的模型使對應數(shù)據(jù)的壓縮率更高；最后則是轉(zhuǎn)碼穩(wěn)定性，這也是一個有意思的問題，包括傳統(tǒng)算法和AI算法間的互編互解，例如將JPEG二次壓縮再解碼，過程中是否有性能損失。

-02-

提升RD性能與解碼速度

接下來介紹如何提升RD性能和解碼速度，圖中的白色文字為前人所做的一些早期經(jīng)典研究成果。第一篇為紐約大學的論文，模型成果第一次在PSNR上超過JPEG 2000。第三篇論文的模型成果首次在PSNR上超過BPG，BPG對應H.265的幀內(nèi)壓縮技術，但解碼速度下降了約60倍。

我們的工作自此開始展開，具體表述為下面的黃字部分。首先我們于2021年構造了棋盤格上下文模型，消除了60倍復雜度，又于2022年對模型進行了一些新的改進。

以上是紐約大學在ICLR上發(fā)表的論文，它是一個簡單的變分自編碼器（Variational Auto-Encoders）。它首先將圖像變到一個特征域進行概率估計，然后用熵編碼對特征進行壓縮。該模型是2017年的研究成果，當時已經(jīng)超過了JPEG 2000。

論文作者在加入谷歌后構造了一個新的尺度超先驗模型（Scale Hyperprior）。它的思想是：在壓縮神經(jīng)網(wǎng)絡特征時我們實際使用的是獨立假設，由于它是一個很高維的向量，所以不能使用聯(lián)合概率密度分布。該模型通過引入先驗Z使得要壓縮的特征Y變?yōu)闂l件獨立，因而可以使用概率密度估計和熵編碼算法將特征Y壓縮得更小。該模型中特征Y和先驗Z的碼率之和比2017年論文中Y的碼率更小，這是通過引入更精準的數(shù)學建模帶來的提升。

谷歌接著又對模型做了進一步改進，即前面提到的空間自回歸模型（autoregressive），它的思想是：在壓縮碼字Y時我們并不能做到獨立壓縮，如在壓縮左側(cè)方格圖中的紅色像素時，需一并考慮周邊的黃色像素結(jié)果，這與傳統(tǒng)算法中的幀內(nèi)預測相似，被稱為自回歸。模型效果如右圖所示，其成果第一次超過了BPG，非常有代表性。

接下來介紹我們的算法，剛才提到的自回歸模型要逐個像素串行解碼，速度相當慢。我們在此基礎上提出右圖所示的棋盤格模型。例如在第一次解碼時，我們使用GPU來并行解碼右側(cè)方格圖中所有藍色和黃色的點，第二次解碼紅色和白色點，由此可通過兩次解碼解出整張圖。按照谷歌的原方法，串行復雜度為N^2，使用棋盤格模型，串行復雜度僅為2。

以上為測速結(jié)果，在典型模型上棋盤格模型能加速40到50倍，在變換網(wǎng)絡較大的模型上能加速18到20倍。該研究成果發(fā)表于CVPR 2021。

在2022年CVPR中，我們對原論文進行了改進，將谷歌的自回歸模型和棋盤格模型進行了結(jié)合，成為了一種既有通道自回歸、也有空間上下文的并行上下文模型，該模型取得了非常好的效果。

以上為對模型所做的另一項改進，即將通道劃分改為非均勻劃分。谷歌原模型每個通道分組都為32，需要的分組較多。我們發(fā)現(xiàn)實際上其中信息的分布是不對稱的，只有少數(shù)信息分組比較重要。為了提高速度，我們將非重要分組進行了合并，在提高速度的同時甚至提高了壓縮率。

以上是我們新模型的結(jié)果，顯示為紅色，最終要優(yōu)于VVC，并且與之前的一些網(wǎng)絡速度相近。圖表中橫軸為解碼速度，縱軸為壓縮率。

上表可以更加直觀體現(xiàn)論文研究成果的貢獻，這實際是端到端圖像壓縮領域的一個里程碑式的進展?？梢钥吹剿性贐D-Rate上顯示為負數(shù)的優(yōu)于VVC的方法，其解碼速度都要大于1000，解碼一張圖大約要大于1秒。早期論文的解碼速度都在20到50毫秒。我們的論文首次實現(xiàn)了BD-Rate在約-7%時，解碼速度仍只有50毫秒，這是相當快的速度。

此后我們對VAE框架進行了進一步研究，VAE框架中存在均攤變分推理現(xiàn)象，利用這個現(xiàn)象引入半均攤變分推理，可以在編碼時對碼字進行一定更新并實現(xiàn)很多靈活的控制。如可以實現(xiàn)連續(xù)變碼率，使用同一個解碼器可以解不同碼率的圖像。可以實現(xiàn)任意ROI編碼，還可以去權衡不同的質(zhì)量評價指標，比如PSNR和LPIPS，大家知道這些指標和主觀質(zhì)量的相關性各有不同，權衡不同指標等于在權衡解碼圖像的不同特點。我們將相關方法也擴展到了端到端視頻編解碼上，相關成果發(fā)表在ICML 2023。

這是我們發(fā)在NeurIPS 2022上的一篇論文，端到端圖像壓縮領域除了調(diào)整網(wǎng)絡結(jié)構外，其實會有比較深入的理論背景，我們對理論進行了更深入的探索，將單樣本采樣改為多樣本采樣。造成的結(jié)果是訓練速度會變慢一些，但壓縮和解壓縮速度完全不受影響。利用這個技術我們?nèi)〉昧艘粋€較明顯的壓縮率的提升。

-03-

提升主觀質(zhì)量

下面介紹一下如何提升主觀質(zhì)量。一般編解碼器在進行設計時，優(yōu)化指標為PSNR、 SSIM或VMAF。但它們與主觀質(zhì)量的差距都較大，實際上也不存在與主觀質(zhì)量絕對一致的數(shù)學指標，這給我們造成了很大困難，一般我們會選擇同時優(yōu)化多個數(shù)學指標來使最終的主觀質(zhì)量變好。

在端到端圖像壓縮領域一般會有兩個較常見的數(shù)學指標：PSNR和MS-SSIM，我們希望設計一種模型，在其訓練后使兩種指標都較高，最后的主觀質(zhì)量更好。

通過實驗發(fā)現(xiàn)，我們能夠做到在PSNR不下降的情況下盡可能提升SSIM指標，使主觀質(zhì)量得到提升。

以上為展示效果圖，左上角為原圖，最右側(cè)為VVC結(jié)果。中間以SSIM標記的是使用MS-SSIM做損失函數(shù)訓練的模型所優(yōu)化的結(jié)果，最終會出現(xiàn)色偏。用MSE訓練的結(jié)果在碼率較低的位置（如圖中水的位置）會損失紋理。使用我們的方法訓練的兩個模型可以較好的平衡PSNR和SSIM，不發(fā)生色偏和紋理損失。

在上圖中情況是相同的，尤其在草地部分，MSE結(jié)果草地會較糊，SSIM結(jié)果草地顏色會出現(xiàn)偏差，而經(jīng)過改進后模型的效果是較好的。

谷歌也相當重視提升主觀質(zhì)量這方面工作，在每年的CVPR上都會組織圖像壓縮競賽，該賽事?lián)碛斜容^完善的主觀質(zhì)量評估流程，通過眾包的方式請很多人來看圖，會規(guī)定圖片的分辨率和與屏幕的不同距離來評估解壓圖像的主觀質(zhì)量，競賽的組織者一般是國際上比較知名的一些廠商。

我們也參加了該賽事，使用的方法就是同時優(yōu)化多個數(shù)學指標，第一個是感知損失，第二是重建損失（例如PSNR或SSIM），第三是對抗損失，第四是風格損失，其中三個損失函數(shù)都和深度學習有關。我們將四個損失函數(shù)以一種特定系數(shù)去進行組合，最后優(yōu)化出來的模型在各種評價指標上都是最佳的。

我們以該模型解壓的圖像參賽，最終獲得了所有碼點的第一名。

這是谷歌官網(wǎng)對所有方法的評測結(jié)果，首先我們關注一下主觀質(zhì)量和數(shù)學指標間的關系，例如PSNR，我們可以看到像avif、VVC和HEVC方法的PSNR都較高，但對應的ELO列（人眼看圖的主觀質(zhì)量）都不太好，印證了PSNR和SSIM不代表主觀質(zhì)量這一結(jié)論。

另一方面，可以看到我們方法的解碼速度，它是用PyTorch編寫的，解碼速度達到了460，VVC在谷歌測試中是493。我們的模型主觀質(zhì)量比VVC更好，解碼速度還要更快，但比avif在解碼速度上要慢一些。

不過需要注意的是，它只是參考軟件層面的對比，因為這里的VVC是使用VTM進行測試，AI方法一般是使用PyTorch進行測試，所有方法都沒有進行工業(yè)級的性能優(yōu)化。

-04-

跨平臺編碼

下面講一個看起來比較偏，但實際對編解碼比較重要的問題，即跨平臺解碼。

這個問題主要來自于熵編碼，我們進行熵編碼或算數(shù)編碼時每個碼字的概率不能出錯，如果有任何微小的錯誤，后面的碼點便解不出來。如上圖所示，前面一直在正常解碼，一旦算到某處一個像素不對，那么后面所有的解碼都會出錯，概率錯了所有碼點都解不出來。假如在壓縮圖片時原先使用的硬件丟失，那么圖片數(shù)據(jù)也會永久消失。

這個問題的解決辦法是使圖片的編解碼過程，尤其是熵編碼的概率計算過程不管在何種硬件上（如CPU、GPU還是不同型號的NPU或DSP）計算結(jié)果都完全一致。據(jù)我所知，唯一的方法便是使用完全整數(shù)計算來實現(xiàn)。

首先針對概率計算有關的所有神經(jīng)網(wǎng)絡，我們均使用全整數(shù)推理，同時以使用查找表而非直接計算的方式來進行概率計算。這樣所有過程都是用整數(shù)來實現(xiàn)的，可以確保編解碼具備跨平臺條件。以上工作比較細節(jié)，所以我們公開了一個比較詳細的技術報告，有興趣實現(xiàn)技術落地的可以參考。

上圖為性能對比，我們將新方法和之前類似的方法進行了對比，我們是首先在有上下文的圖像壓縮模型上實現(xiàn)不掉點的整數(shù)推理，而且我們的量化方案比較標準，沒用對激活值進行逐個通道的分組量化，適用于常見的GPU和NPU。

-05-

優(yōu)化延時與吞吐

最后關于有損壓縮方面介紹一下優(yōu)化延時與吞吐。優(yōu)化一個AI編解碼器的速度主要包括兩部分工作：一是優(yōu)化神經(jīng)網(wǎng)絡推理的延時，另一個是優(yōu)化熵編碼的延時。最后整個系統(tǒng)要做一個代碼層面或者軟件工程層面的優(yōu)化。

首先看一下神經(jīng)網(wǎng)絡的優(yōu)化，它的方法都是比較標準的。其中一個是神經(jīng)網(wǎng)絡架構搜索（NAS），一個是模型量化。NAS提升顯得較小是因為這些神經(jīng)網(wǎng)絡已經(jīng)經(jīng)過了人工優(yōu)化。左下角是它的CPU和GPU顯存占用情況。由于針對此模型我們主要調(diào)整它的主觀質(zhì)量，所以它的PSNR會弱一些?？梢钥吹皆撃Ｐ偷腜SNR比avif低，但SSIM值很高。

在本頁我們想回答一個問題，神經(jīng)網(wǎng)絡圖像壓縮和傳統(tǒng)方法相比性能有何差距？我們希望進行相對公平的對比。首先要使用相同的硬件，例如都使用CPU，以編解碼延時來衡量，神經(jīng)網(wǎng)絡圖像壓縮和JPEG XL和avif在性能上是接近的，如果我們將avif和JPEG XL作為工業(yè)應用的發(fā)展方向，顯然神經(jīng)網(wǎng)絡圖像壓縮也可以作為一個發(fā)展方向。

如果我們看GPU，可以發(fā)現(xiàn)在相同的輸入條件下，神經(jīng)網(wǎng)絡方法和JPEG-turbo相比，它在編解碼上并沒有很大的劣勢，解碼還要快一些。

但這里有一個關于線程的小問題，從JPEG官網(wǎng)來看，它的測試也會有一些問題，就是到底采用什么樣的線程數(shù)來測試這些模型，使用不同的線程數(shù)測試結(jié)果也不同。我們采用了單線程進行測試，對于傳統(tǒng)方法采用的是默認配置，使用多線程在測吞吐時會有更大優(yōu)勢，具體可以參考我們的技術報告。這個結(jié)果可以作為一個參考，實際使用中應該結(jié)合運行環(huán)境進一步對線程資源進行適配。

-06-

應用拓展：JPEG無損壓縮

剛才介紹了有損壓縮，接下來分享一個比較有意思的應用，即無損壓縮。假如端到端有損壓縮方法實際落地要等很長時間，那么我們現(xiàn)在已經(jīng)有了非常多的JPEG圖像，能不能考慮使用AI方法對這些圖像進行無損壓縮。

其實已經(jīng)有人注意到這個問題，但使用的不是神經(jīng)網(wǎng)絡，例如JPEG XL或者Dropbox的Lepton，Lepton目前已經(jīng)被Dropbox使用了很久，它的思想是在進行云存儲時對JPEG圖像進行無損二次壓縮，在不改變用戶數(shù)據(jù)的同時極大壓縮存儲量。所以它整個生態(tài)不會受到任何影響，在網(wǎng)絡上還是以JPEG格式進行傳遞，但是云存儲使用的是二次壓縮后的碼流。

就此我們在CVPR上也發(fā)表了一篇文章，專門介紹如何使用神經(jīng)網(wǎng)絡來無損壓縮JPEG圖像。在這里對研究內(nèi)容做一個簡單介紹，首先我們將JPEG圖像的三個分量（YUV或YCbCr）整合成一個引變量Z，整合后的Z涵蓋了YUV之間的關聯(lián)，在壓縮YUV三個分量前使用Z來作為先驗。Y叫作亮度分量，由于它包含的信息最多，所以我們?yōu)檫@個分量專門設計一個模型叫作MLCC，它的結(jié)構如下。

MLCC是一種比較復雜的并行自回歸模型。左圖中為JPEG的dct系數(shù)，我們對它進行重新排列，將相同頻率排到神經(jīng)網(wǎng)絡的相同通道上得到右圖，并將右圖中三維長方體的行列進行展開，按照類似自回歸的方式進行條件建模。它看起來很復雜，但實際執(zhí)行的速度還是很快的。

以上為測速結(jié)果，Dropbox在大規(guī)模使用的Lepton，其無損壓縮率是20%左右，編碼解碼時間分別是0.239和0127。JPEG XL稍差，但編碼稍微快一些。作為傳統(tǒng)算法中號稱最強的無損壓縮器CMIX，它的壓縮率能達到23%或27%，但編碼和解碼時間都很長，要150秒。該軟件是壓縮從業(yè)者為了探索無損壓縮極限構造出的一套十分復雜的模型，它的算力消耗和內(nèi)存消耗都非常非常大。

我們的神經(jīng)網(wǎng)絡方法壓縮率可以達到29%或30%以上，優(yōu)于CMIX，使用PyTorch在GPU上的編解碼時間大約為1秒，比Lepton要慢約十倍。

不過我們要知道Lepton不是一個參考軟件，而是一個工業(yè)軟件，我們的算法作為學術上的參考軟件，兩者gap并不大。

我們也將神經(jīng)網(wǎng)絡方法和之前做無損壓縮的一些網(wǎng)絡結(jié)構進行了對比，可以看到本方法的編解碼時間實際是比較短的。

小結(jié)

下面進行一個小結(jié)。經(jīng)過剛才提到的一些優(yōu)化，AI編解碼方法整體上在一些場景下是可以使用的，但在我剛才提到的六個維度上還有一些持續(xù)的挑戰(zhàn)。

本次分享的內(nèi)容來自這些已經(jīng)發(fā)表或公開的論文和技術報告，感謝商湯科技和清華大學的合作者。

審核編輯：劉清

閱讀全文

解碼器(40056) 解碼器(40056)
NAS(111780) NAS(111780)
編解碼器(23964) 編解碼器(23964)
PSN(2295) PSN(2295)
pytorch(12788) pytorch(12788)

USB3.0中8b/10b編解碼器的設計

為了在USB 3.0中實現(xiàn)數(shù)據(jù)的8 b/10 b編解碼，把8b/10b編解碼分解成5 b/6 b編解碼和3 b/4 b編解碼，然后在FPGA上實現(xiàn)了具體的硬件電路。

2011-11-30 11:38:18

2803

音頻編解碼器技術

語音編解碼器技術的發(fā)展一定程度上處于靜止狀態(tài)，但音頻編解碼器技術一直在向前演進。音頻編解碼器朝更多的環(huán)繞聲通道發(fā)展就是一個趨勢。

2012-02-03 16:17:11

4774

53小波的EZW壓縮編解碼

53小波的EZW壓縮編解碼FPGA實現(xiàn)，有了解的麻煩指點下，謝謝！

2014-06-22 11:25:36

編解碼器的工作原理是什么？

編解碼器是用于對數(shù)字媒體文件（如歌曲或視頻）進行壓縮或解壓縮的軟件。Windows Media Player 和其他程序使用編解碼器來播放并創(chuàng)建數(shù)字媒體文件。

2020-04-06 09:00:42

Android硬編解碼如何去實現(xiàn)呢

Android硬編解碼主要用MediaCodec實現(xiàn)。以下是Android官方的使用說明：我就用MediaCodec做一個demo，實現(xiàn)硬編解碼攝像的的preview數(shù)據(jù)。demo界面如圖：程序界面

2022-04-11 14:39:36

FPGA進行視頻編解碼

         求助用FPGA進行視頻編解碼，可行嗎？尤其在高清領域，F(xiàn)PGA強大的計算能力似乎很有優(yōu)勢，但算法極其復雜，各位高手指點指點。

2009-02-06 09:40:04

Firefly-RK3399多路視頻編解碼

Firefly-RK3399開源板擁有強大的視像處理器（VPU），能夠流暢的實現(xiàn)H.264編解碼功能，可以同時進行兩路視頻編碼和五路視頻解碼。在應用方面，多路編解碼功能可以更優(yōu)秀地應用于同時錄像和播放多個視頻的場景。

2017-09-02 09:52:37

Hi3521DV200 H.265編解碼

2021-07-22 09:13:40

ISD91260編解碼格式如何選擇？

我正在使用 I91260 語音芯片，我在SDS 看到有不同的編解碼格式（AudioPlayback MD4 NuOneEx ...）我想知道這些格式有什么區(qū)別，我如何更好的選擇使用那個格式？我的另一個問題是，在那個文檔展示了關于音頻編解碼的介紹，比如采樣率，通道選擇等描述

2023-06-13 06:16:22

openharmony怎么調(diào)用GPU進行視頻和圖片的編解碼？

openharmony怎么調(diào)用芯片里的GPU進行視頻和圖片的編解碼？每個不同的芯片需要單獨調(diào)整適配嗎？

2023-08-14 15:10:26

opus編解碼的相關資料分享

）====================================================================版權歸作者所有，未經(jīng)允許，請勿轉(zhuǎn)載。====================================================================一、opus編解碼簡介Opus是一個完全開放，免版稅，高度通用的音頻編解碼器。在互聯(lián)網(wǎng)上Opus是交互式語音和音樂傳輸，也

2021-12-24 06:56:37

proteus里有什么編解碼芯片？

proteus里有什么編解碼芯片？特別是能用于做航模遙控的

2014-08-03 14:46:45

什么是可變碼流編解碼技術

可變碼流編解碼技術是指編解碼器可根據(jù)數(shù)據(jù)量的大小自動調(diào)節(jié)帶寬，遇到圖像變化較快，顏色較豐富時分配的帶寬大一些；圖像變化較慢，顏色較不豐富時分配的帶寬小一些，這樣在保證圖像錄制質(zhì)量的同時最大限度地節(jié)省硬盤了空間。

2008-12-29 12:25:08

什么是固定碼流編解碼

固定碼流編解碼 提供的帶寬是固定的，不管數(shù)據(jù)量的大小，當圖像顏色豐富，變化較快時，往往帶寬不夠而降低錄像的質(zhì)量，看起來圖像有點停頓或色彩變樣；而圖像數(shù)據(jù)量不大時，提供的帶寬有多于，浪費存儲空間。

2008-12-29 12:24:09

什么是基于FFmpeg的視頻硬件編解碼？

目前，智能手機、PDA和平板電腦等越來越多的嵌入式設備支持高清視頻采集和播放功能,高清視頻的采集或播放功能正廣泛用于游戲設備、監(jiān)控設備、視頻會議設備和數(shù)字網(wǎng)絡電視等嵌入式系統(tǒng)中。這些功能的實現(xiàn)建立在高性能視頻硬件編解碼技術基礎之上。

2019-11-01 08:19:32

關于音頻的PCM編解碼幾點疑問

小弟最近在做2013年國賽題目紅外通信裝置，其實核心就是對音頻信號進行PCM編解碼，其中我們用到了MC14LC5480這款PCM編解碼芯片，其中有幾個疑問1.看全英文的文檔介紹說有四種工作模式，但我

2016-03-15 11:30:37

初識紅外編解碼

初識紅外編解碼

2021-08-16 06:35:47

圖像傳感器圖像壓縮編解碼技術

圖像傳感器圖像壓縮編解碼技術圖像傳感器在人們的文化、體育、生產(chǎn)、生活和科學研究中起到非常重要的作用?？梢哉f，現(xiàn)代人類活動已經(jīng)無法離開圖像傳感器。2013年圖形圖像技術應用大會拓寬研發(fā)思路，提高

2013-09-17 15:04:56

基于FPGA的HDB3編解碼系統(tǒng)

基于FPGA的HDB3編解碼系統(tǒng)，誰有這方面的資料，謝了！

2013-04-07 15:14:45

如何去設計ADPCM語音編解碼電路？

ADPCM算法及其編解碼器原理是什么？如何去設計ADPCM語音編解碼電路？

2021-05-06 06:37:15

如何控制曼徹斯特編解碼器？

怎樣運用CPLD去控制曼徹斯特編解碼器？

2021-05-07 07:09:08

如何進行編解碼性能測試？是否有參考程序？

如何進行編解碼性能測試？是否有參考程序？

2023-09-19 06:56:41

求一種MPEG-4視頻編解碼的設計方案

如何去實現(xiàn)MPEG-4視頻編解碼的硬件設計？如何去實現(xiàn)MPEG-4視頻編解碼的軟件設計？

2021-06-04 06:12:55

請問Nuc972與nuc32905的編解碼有聲明區(qū)別？

Nuc972與nuc32905的編解碼有聲明區(qū)別？我看nuc972也有編解碼功能呀。為什么還要有nuc32905系列呢?

2023-06-15 08:35:21

請問怎樣去設計曼徹斯特編解碼器？

一種基于CPLD的曼徹斯特編解碼器設計。

2021-05-06 10:32:05

音視頻編解碼的標準

音視頻編解碼標準簡介

2021-01-21 06:53:21

音頻編解碼與ADC和DAC是什么關系？

本人完全未接觸過音頻編解碼，最近因為需要了解了一下音頻編解碼的芯片，其中均集成了ADC和DAC，想請教一下，音頻編解碼與ADC和DAC是什么關系？（我理解是：ADC是編碼的基礎，DAC是解碼的基礎，解碼其實就是將數(shù)字量經(jīng)DAC后生成了模擬量在經(jīng)運放等恢復音頻，不知對否？）

2014-08-07 15:22:30

音頻記錄PCM編解碼系統(tǒng)

本帖最后由 luna 于 2011-3-3 14:44 編輯 PCM編解碼系統(tǒng)中的編碼器，傳輸變換兩路音頻信號為一路帶有冗余信息的PCM信號。冗余信息包含糾正記錄或重放期間產(chǎn)生的隨機誤差所增加

2011-03-03 00:08:17

高速并行Reed-Solomon編解碼器怎么實現(xiàn)？

RS編解碼原理是什么如何實現(xiàn)RS編解碼器？

2021-04-29 06:11:40

一個非常朋克的技術-那什么是幀率與編碼方式呢？#視頻剪輯 #視頻編解碼

解碼編解碼視頻技術

面包車發(fā)布于 2022-07-29 15:10:59

為什么需要視頻編碼，它的原理又是什么？#視頻編解碼

解碼編解碼視頻技術

面包車發(fā)布于 2022-07-29 15:12:03

為什么需要視頻編碼，它的原理又是什么？第二集#視頻編解碼 #視頻編解碼

解碼編解碼視頻技術

面包車發(fā)布于 2022-07-29 15:12:56

為什么需要視頻編碼，它的原理又是什么？第一集 #視頻編解碼

解碼編解碼視頻技術視頻編解碼

面包車發(fā)布于 2022-07-29 15:13:27

基于CPLD的卷積碼編解碼器的設計

卷積碼是一種性能優(yōu)良的差錯控制編碼。本文闡述了卷積碼編解碼器的基本工作原理，在MAX+PLUS2 軟件平臺上，給出了利用復雜可編程邏輯器件設計的（2，1，6）卷積碼編解碼器電路

2009-08-10 08:39:06

G.726語音編解碼器在SoPC中的實現(xiàn)

在對G.726 語音編解碼標準分析的基礎上給出了基于FPGA 的DSP 設計流程,利用MATLAB/Simulink、DSP Builder 和SOPC Builder 工具設計了G.726 語音編解碼器,通過仿真實驗驗證了所設計的編解碼器模

2009-11-30 14:59:24

接口協(xié)議智能編解碼方法研究

針對當前復雜信息系統(tǒng)仿真中,關于接口協(xié)議編解碼方法的缺陷,從接口協(xié)議的存儲、程序設計的數(shù)據(jù)結(jié)構和編解碼流程幾個方面,給出了復雜信息系統(tǒng)仿真中接口協(xié)議編解碼方法的詳

2010-02-21 11:07:54

基于CPLD的HDB3碼編解碼電路的設計

HDB3碼是基帶傳輸系統(tǒng)中經(jīng)常采用的傳輸碼型。本文闡述了HDB3碼編解碼電路的基本原理,在MAX+PLUSⅡ軟件平臺上,給出了利用復雜可編程邏輯器件設計的HDB3碼編解碼電路,并進行了編譯和

2010-02-24 15:59:48

基于CD22103的AMI/HDB3編解碼電路設計

基于AMI／HDB3編解碼原理，設計了一種用CD22103集成芯片實~AMI／HDB3編解碼的硬件電路．詳細分析了編解碼的實現(xiàn)過程、單雙極性變換及位同步，最后給出實驗結(jié)果并分析了編解碼時延

2010-04-13 08:56:28

145

音頻記錄PCM編解碼系統(tǒng)

主題內(nèi)容與適用范圍本標準規(guī)定了PCM編解碼系統(tǒng)信號的格式和其他有關條件。本標準適用于錄像系統(tǒng)錄放音頻信號用的PCM編解碼器。系統(tǒng)說明 PCM編解碼

2010-08-31 18:26:25

基于TR600語音編解碼芯片的過程調(diào)用設計

介紹了TR600語音編解碼芯片中過程調(diào)用的設計及實現(xiàn)方法，并與堆棧寄存器結(jié)構實現(xiàn)方式做了簡要的比較，重點闡述了重疊寄存器窗口技術和存取算子對存儲體交叉訪問技術的原理、

2010-11-19 15:13:24

高速并行RS編解碼器

采用多路復用流水線的思想，設計基于FPGA仿真測試的RS編解碼的改進IBM算法，使用Verilog硬件編程語言實現(xiàn)，進一步提高RS編解碼器的運行速度及糾錯能力，擴大應用范圍。系統(tǒng)設計

2010-12-22 17:02:40

頻域相位編解碼OCDMA系統(tǒng)

頻域相位編解碼OCDMA系統(tǒng) 基于頻域相位編解碼OCDMA通信系統(tǒng)如圖1所示[3]。頻域相位編解碼OCDMA通信系統(tǒng)，無論是在實驗還是理論方面，相對

2009-02-28 11:32:43

1009

用XC9572實現(xiàn)HDB3編解碼設計

用XC9572實現(xiàn)HDB3編解碼設計介紹了HDB3編解碼的原理和方法，給出了用CPLD（Complex Programmable Logic Device）實現(xiàn)E1信號HDB3編解碼的方法，同時給出了它的實現(xiàn)原

2009-03-28 15:15:10

1461

什么是音頻編解碼器？

什么是音頻編解碼器？ 編解碼器（編碼器/解碼器）轉(zhuǎn)換成模擬信號的數(shù)字碼流，另一個相同的編解碼器轉(zhuǎn)換為數(shù)字流回到成模擬信

2009-05-03 23:48:59

3870

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎1-1

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:44:21

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎1-2

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:51:03

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎1-3

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:52:03

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎1-4

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:55:57

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎1-5

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:57:04

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎2-1

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:58:53

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎2-2

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 16:59:35

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎2-3

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 17:01:32

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎2-4

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 17:03:16

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎2-5

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 17:03:52

#硬聲創(chuàng)作季 #視頻技術視頻技術-視頻編解碼技術基礎2-6

視頻解碼編解碼視頻技術視頻編解碼

水管工發(fā)布于 2022-10-12 17:05:50

用CPLD控制曼徹斯特編解碼器

討論如何使用CPLD實現(xiàn)單片機與曼徹斯特編解碼器的接口。設計時采用自頂向下的流程,具體電路可靈活地添加到各種曼徹斯特碼接口系統(tǒng)中。關鍵詞曼徹斯特編解碼器 T2模

2009-06-16 07:40:18

1251

IPTV音視頻編解碼技術

IPTV音視頻編解碼技術三足鼎立　　當前在IPTV業(yè)務中，音視頻編解碼技術的選擇呈現(xiàn)了三足鼎立的狀況，即MPEG4ASP、H.264和AVS。其中MPEG4和H.264都是國際相關組織

2009-11-27 10:04:40

951

基于FPGA的8B／10B編解碼設計

摘要：為提高8B／10B編解碼的工作速度和簡化邏輯方法，提出一種基于FPGA的8B／10B編解碼系統(tǒng)設計方案。與現(xiàn)有的8B／10B編解碼方案相比，該方案是一種利用FPGA實現(xiàn)8B／lOB編解碼的模塊方

2011-05-26 11:08:20

3366

多帶激勵MBE譜幅度估計與參數(shù)編解碼方案研究

隨著多帶激勵MBE模型的成功運用，MBE語音編解碼算法也日新月易。介紹了多帶激勵MBE譜幅度參數(shù)和V/U判決參數(shù)的提取，闡述了參數(shù)的編解碼方案，對譜幅度量化時，先作離散余弦變換（

2011-08-30 15:23:58

RS編解碼過程及軟件實現(xiàn)

結(jié)合RS碼的基本特性,講述了RS碼的編解碼過程,給出了經(jīng)過實際驗證的RS編解碼在超短波跳頻電臺開發(fā)中的軟件應用實例。

2012-02-13 10:07:26

數(shù)字視頻編解碼技術回顧及展望

數(shù)字視頻編解碼技術領域的特點是種類繁多、多類型并存、新舊共存、研發(fā)成果日新月異。目前沒有那種數(shù)字視頻編解碼技術可以替代其它所有的數(shù)字視頻編解碼技術。系統(tǒng)了解數(shù)字視頻編解碼技術是認識運動視覺感知技術

2013-04-03 09:39:27

973

E文JPEG編解碼介紹

E文JPEG編解碼介紹，很好的資料，快來學習吧

2016-02-18 14:14:31

13曼徹斯特碼編解碼的FPGA設計與實現(xiàn)-9

13曼徹斯特碼編解碼的FPGA設計與實現(xiàn)-9。

2016-04-26 15:12:57

RS編解碼的FPGA實現(xiàn)-說明

RS編解碼的FPGA實現(xiàn)-說明RS編解碼的FPGA實現(xiàn)-說明。

2016-05-04 15:59:44

六路編解碼電路原理圖

六路編解碼電路原理圖都是值得參考的設計。

2016-05-11 17:00:47

四路編解碼電路原理圖

四路編解碼電路原理圖都是值得參考的設計。

2016-05-11 17:33:19

循環(huán)碼編解碼電路的EDA設計

循環(huán)碼編解碼電路的EDA設計。

2016-05-20 11:47:38

基于FPGA的JPEG實時圖像編解碼系統(tǒng)

基于FPGA的JPEG實時圖像編解碼系統(tǒng)

2016-08-29 16:05:01

網(wǎng)絡視頻編解碼器5000

網(wǎng)絡視頻編解碼器5000

2016-12-23 02:20:28

通信接口——編解碼

通信接口——編解碼

2017-09-04 09:39:45

基于Cortex_A8多媒體編解碼優(yōu)化

基于Cortex_A8多媒體編解碼優(yōu)化

2017-09-25 13:20:56

紅外遙控編解碼相關資料分享

本文分享了紅外遙控編解碼的相關資料。

2017-11-16 14:40:41

分析了各主流編解碼器的優(yōu)勢與不足，并對編解碼器的選擇給出建議

盡管AV1和AVS2走向成熟還需時日，但至少讓用戶有了更多選擇。Hulu全球高級研發(fā)經(jīng)理傅德良撰文分析了各主流編解碼器的優(yōu)勢與不足，并對編解碼器的選擇給出了自己的建議。

2018-02-06 14:23:15

13880

FFMPEG視頻編解碼流程 H.264硬件編解碼實現(xiàn)

本文闡述了基于FFMpeg的 H.264視頻硬件編解碼在 S3C6410 處理器上的實現(xiàn)方法,為數(shù)字娛樂、視頻監(jiān)控和視頻通信系統(tǒng)開發(fā)過程中的高清視頻硬件編解碼的實現(xiàn)提供參考。

2018-04-03 11:28:00

18638

STM32培訓：介紹STM32 USB音頻編解碼

STM32 USB音頻編解碼

2018-07-05 00:24:00

8286

視頻編解碼器是什么，編解碼器技術原理作用

一、什么是視頻編解碼器?視頻編解碼器，是指一個能夠?qū)?shù)字視頻進行壓縮或者解壓縮的程序或者設備。壓縮和可能改變視頻內(nèi)容格式的過程，將模擬源更改為數(shù)字源。音頻和視頻都需要可定制的壓縮方法。在壓縮方面

2019-06-24 19:02:12

12313

如何使用L9320實現(xiàn)ADPCM語音編解碼

L9320是LANWAVE公司推出的一款自適應音頻脈沖編碼（ADPCM）編解碼器。該器件除具有正常的ADPCM編碼解碼模式外，還有PCM編解碼模式、電源測試模式以及編解碼器測試模式。文中主要

2019-12-20 17:27:09

BCH編解碼器在NAND Flash主控中的研究與優(yōu)化

闡述在BCH編解碼器在NAND Flash主控中的研究與優(yōu)化。

2021-03-17 13:50:50

從Satin到Lyra為什么微軟、谷歌都盯向音頻編解碼器？

回顧今年的2月份，可以說是音頻編解碼器最為熱鬧的一個月。先是微軟宣布推出最新款由AI支持的音頻編解碼器——Satin。僅一周后，谷歌推出了用于語音壓縮的新型超低比特率音頻編解碼器——Lyra，并且

2021-05-24 15:36:30

2344

PCM語音編解碼及原理圖下載

PCM語音編解碼及原理圖下載

2021-07-14 09:56:33

NANDFLASH快速BCH編解碼算法及便件實現(xiàn)

NANDFLASH快速BCH編解碼算法及便件實現(xiàn)(嵌入式開發(fā)自學網(wǎng))-NANDFLASH快速BCH編解碼算法及便件實現(xiàn)? ? ? ??

2021-07-30 14:14:40

視頻編碼包括什么？視頻編解碼器是如何工作的？

視頻編碼包括什么，視頻編解碼器是如何工作的?我們將在下面深入挖掘，并涵蓋我們的流媒體最佳視頻編解碼器列表。

2023-04-21 10:42:04

1304

HDB3編解碼簡析

此次需求提供的十分明確，給出了編碼規(guī)則及示例，明確了編解碼端口要求；仿真模塊根據(jù)設計進行適配。

2023-05-15 10:41:01

1001

什么是編解碼一體機？

編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備。這種設備通?；谠朴嬎慵夹g和先進的編解碼算法，能夠高效地處理視頻流，提供低延遲、高穩(wěn)定性的音視頻傳輸服務。此外，編解碼

2024-01-31 14:19:36

172

音頻處理的新選擇：編解碼一體機

編解碼一體機作為音頻處理的新選擇，以其高效、靈活的解決方案，引領著音頻處理技術的新篇章。這種設備集成了音頻編解碼和數(shù)據(jù)傳輸功能，將復雜的音頻處理流程簡化在一臺設備中，提高了音頻處理的效率和靈活性

2024-01-31 14:46:16

135

從編解碼一體機看視頻處理技術的未來

從編解碼一體機的發(fā)展趨勢來看，視頻處理技術未來將朝著以下幾個方向發(fā)展：高效編解碼技術：隨著視頻分辨率和碼率的不斷提高，對編解碼效率的要求也越來越高。未來，編解碼一體機將采用更先進的編解碼算法

2024-01-31 14:47:25

144

編解碼一體機：技術、應用與挑戰(zhàn)

編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備。它基于云計算技術，具有高效、實時的視頻處理能力，廣泛應用于安防監(jiān)控、視頻會議、教育錄播等領域。首先，編解碼一體機采用

2024-01-31 14:48:04

149

如何選擇最適合你的編解碼一體機？

選擇最適合自己的編解碼一體機需要考慮以下幾個方面：應用場景：首先需要明確編解碼一體機的應用場景，如視頻會議、安防監(jiān)控、教育錄播等。不同的應用場景對編解碼一體機的性能要求不同，需要根據(jù)具體需求

2024-01-31 14:49:08

173

編解碼一體機相對于傳統(tǒng)的編解碼設備有哪些優(yōu)勢？

編解碼一體機相對于傳統(tǒng)的編解碼設備具有多個優(yōu)勢。以下是編解碼一體機的幾個主要優(yōu)勢：高效實時的視頻處理能力：編解碼一體機采用先進的編解碼算法和云計算技術，能夠?qū)崿F(xiàn)高效、實時的視頻處理，滿足各種應用場

2024-01-31 14:56:04

291

編解碼一體機的主要應用場景是什么？

編解碼一體機是一種集視頻編解碼、音頻編碼以及數(shù)據(jù)傳輸功能于一體的多媒體設備，廣泛應用于各個領域。以下是編解碼一體機的幾個主要應用場景：來百度APP暢享高清圖片視頻會議：編解碼一體機可以為視頻會議

2024-01-31 14:57:21

146

已全部加載完成

搜索歷史

走向?qū)嵱玫腁I編解碼闡述

評論