利用AI實現(xiàn)圖像的超級壓縮
神經(jīng)網(wǎng)絡這樣的數(shù)據(jù)驅動算法,已經(jīng)狂風暴雨般的席卷了世界,包括廉價且強大的硬件和大量的數(shù)據(jù)等方面的因素,導致AI技術的突飛猛進。
神經(jīng)網(wǎng)絡是當前“圖像識別”、“自然語言理解”等“認知”領域的最新技術,但其應用并不限于這些。在這篇文章中,我們將討論一種使用神經(jīng)網(wǎng)絡壓縮圖像的方法,該方法能以更快的速度,達到圖像壓縮技術的最優(yōu)化。
該文基于論文:An End-to-End CompressionFramework Based on Convolutional Neural Networks(https://arxiv.org/pdf/1708.00838v1.pdf)
本文假設,你對包括卷積和損失函數(shù)等神經(jīng)網(wǎng)絡有一定了解。
▍什么是圖像壓縮?
圖像壓縮是將圖像轉換為更小占用空間的過程。原始圖像存儲將占用大量空間,因此會使用編解碼器減小原始圖像的大小,例如JPEG和PNG。
圖像壓縮有兩種類型:無損和有損。
顧名思義,在無損壓縮中,可能獲取原始圖像的所有數(shù)據(jù),而在有損壓縮中,一些數(shù)據(jù)在轉換過程中丟失。
例如:JPG是一種有損算法,而PNG是一種無損算法。
圖1.0:無損和有損壓縮之間的比較
能看到右邊的圖像有許多塊狀的紋路,這就是信息的丟失。相似顏色的臨近像素被壓縮為一個區(qū)塊,這節(jié)省了空間,但也丟失了關于實際像素的信息。
圖示只是有損壓縮的直觀示例,真實的JPEG,PNG等編解碼器所使用的算法要復雜得多。無損壓縮當然更好,但最終在磁盤上占用的空間太多。
當然,有更好的方法壓縮圖像而不會丟失太多的信息,但是它們相當慢,許多算法使用迭代的方式,這意味著它們不能在多個CPU內核或GPU上并行運行。這使得這些算法在日常使用中不實用。
▍卷積神經(jīng)網(wǎng)絡
如果任務需要計算,且可以近似計算,就可以考慮使用神經(jīng)網(wǎng)絡。論文作者使用了相當標準的卷積神經(jīng)網(wǎng)絡來改善圖像壓縮。他們的方法不僅僅是“更好的方式”,還可以利用并行計算,實現(xiàn)高速壓縮。
其背后原理是卷積神經(jīng)網(wǎng)絡(CNN),能很好地從圖像中提取空間信息,然后以更緊湊的表征來表示(例如,僅存儲圖像的“重要”位點)。論文作者利用CNN的這種能力來更好地壓縮、展示圖像。
▍架構
論文提出了一個雙重網(wǎng)絡。第一層網(wǎng)絡(ComCNN)提取圖像信息并生成一個致密表征。然后,該網(wǎng)絡的輸出將由標準編解碼器(例如JPEG)來處理。
經(jīng)過編解碼器后,圖像將被傳遞到第二層網(wǎng)絡,該層網(wǎng)絡將從編解碼器“修復”圖像,試圖恢復原始圖像。作者稱之為重建卷積神經(jīng)網(wǎng)絡(RecCNN)。這兩個網(wǎng)絡都經(jīng)迭代訓練,類似生成對抗網(wǎng)絡(GAN)。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
利用AI實現(xiàn)圖像的超級壓縮下載
相關電子資料下載
- Arm物聯(lián)網(wǎng)事業(yè)部業(yè)務拓展副總裁馬?。喝绾螏椭鶤IoT企業(yè)加速創(chuàng)新? 21
- Blackwell GB100能否在超級計算機和AI市場保持領先優(yōu)勢? 174
- 訊飛星火大模型V3.0正式發(fā)布,全面對標ChatGPT 299
- 亞馬遜云科技生成式AI最新案例分析,助力企業(yè)業(yè)務創(chuàng)新迭代 57
- 新思科技攜手臺積公司加速N2工藝下的SoC創(chuàng)新 196
- 服務器硬盤通用基礎知識 19
- 常見的一級指針參數(shù)有什么作用 73
- NVIDIA AI 現(xiàn)已在 Oracle Cloud Marketplace 推出 33
- CNCC | 論壇:探索 AI 全棧解決方案和基于 LLM 的推理與部署實踐 36
- Prophesee的GenX320第五代DVS傳感器產(chǎn)品參數(shù)介紹 31