聲音其實(shí)是一種能量波,因此也有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線,振幅對(duì)應(yīng)于電平軸線。我們知道,在可聽見的聲音中,話音信號(hào)的頻段在80Hz到3400Hz之間,音樂信號(hào)的頻段在20Hz-20kHz之間,語音(話音)和音樂是多媒體技術(shù)重點(diǎn)處理的對(duì)象。通常人耳可以聽到的頻率在20Hz到20KHz的聲波稱為為可聽聲,低于20Hz的成為次聲,高于20KHz的為超聲,多媒體技術(shù)中只研究可聽聲部分。
一:數(shù)字化音頻的三個(gè)主要步驟
由于模擬聲音在時(shí)間上是連續(xù)的,麥克風(fēng)采集的聲音信號(hào)還需要經(jīng)過數(shù)字化處理后才能由計(jì)算機(jī)處理。通常我們采用PCM編碼(脈沖代碼調(diào)制編碼),即通過采樣、量化、編碼三個(gè)步驟將連續(xù)變化的模擬信號(hào)轉(zhuǎn)換為數(shù)字編碼。
1、采樣
采樣,就是每隔一段時(shí)間間隔讀一次聲音的幅度。單位時(shí)間內(nèi)采樣的次數(shù)稱為采樣頻率。顯然采樣頻率越高,所得到的離散幅值的數(shù)據(jù)點(diǎn)就越逼近于連續(xù)的模擬音頻信號(hào)曲線,同時(shí)采樣的數(shù)據(jù)量也越大。
為了保證數(shù)字化的音頻能夠準(zhǔn)確(可逆)地還原成模擬音頻進(jìn)行輸出,采樣定理要求:采樣頻率必須大于等于模擬信號(hào)頻譜中的最高頻率的2倍。
常用的音頻采樣率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。
例如:話音信號(hào)頻率在0.3~3.4kHz范圍內(nèi),用8kHz的抽樣頻率(fs),就可獲得能取代原來連續(xù)話音信號(hào)的抽樣信號(hào),而一般CD采集采樣頻率為44.1kHz。
2、量化
量化,就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值,用于表示信號(hào)強(qiáng)度。
量化精度:用多少個(gè)二進(jìn)位來表示每一個(gè)采樣值,也稱為量化位數(shù)。聲音信號(hào)的量化位數(shù)一般是 4,6,8,12或16 bits 。
由采樣頻率和量化精度可以知道,相對(duì)自然界的信號(hào),音頻編碼最多只能做到無限接近,在計(jì)算機(jī)應(yīng)用中,能夠達(dá)到最高保真水平的就是PCM編碼,通常PCM約定俗成了無損編碼。
3、編碼
一個(gè)采樣率為44.1kHz,量化精度為16bit,雙聲道的PCM編碼輸出,它的數(shù)據(jù)速率則為 44.1K×16×2 =1411.2 Kbps,存儲(chǔ)一秒鐘需要176.4KB的空間,1分鐘則約為10.34M,因此,為了降低傳輸或存儲(chǔ)的費(fèi)用,就必須對(duì)數(shù)字音頻信號(hào)進(jìn)行編碼壓縮。
到目前為止,音頻信號(hào)經(jīng)壓縮后的數(shù)碼率降低到32至256kbit/s,語音可以低至8kbit/s以下。
對(duì)數(shù)字音頻信息的編碼進(jìn)行壓縮的目的是在不影響人們使用的情況下使數(shù)字音頻信息的數(shù)據(jù)量最少。通常用如下6個(gè)屬性來衡量:
—比特率;
—信號(hào)的帶寬;
—主觀/客觀的語音質(zhì)量;
—延遲;
—計(jì)算復(fù)雜度和對(duì)存儲(chǔ)器的要求;
—對(duì)于通道誤碼的靈敏度;
為使編碼后的音頻信息可以被廣泛地使用,在進(jìn)行音頻信息編碼時(shí)需要采用標(biāo)準(zhǔn)的算法。傳統(tǒng)會(huì)議電視設(shè)備主要采用ITU-T推薦的G.711、G.722、G.728和AAC_LD等音頻標(biāo)準(zhǔn)。
在音頻設(shè)備的介紹里面會(huì)經(jīng)常看到產(chǎn)品資料里有各式各樣所支持的音頻格式和協(xié)議,下面我們來詳細(xì)講解下藍(lán)牙耳機(jī)、會(huì)議電視的常用音頻協(xié)議。
編輯推薦:音頻、視頻領(lǐng)域相關(guān)國(guó)際標(biāo)準(zhǔn)有哪些
?
藍(lán)牙耳機(jī)常用音頻協(xié)議有哪些

HFP:HFP(Hands-free Profile),讓藍(lán)牙設(shè)備可以控制電話,如接聽、掛斷、拒接、語音撥號(hào)等,拒接、語音撥號(hào)要視藍(lán)牙耳機(jī)及電話是否支持。汽車內(nèi)的汽車套件是常見的使用情景。汽車套件將連接至手機(jī)并用于撥打和接聽電話。將無線耳機(jī)連接至手機(jī)后使用耳機(jī)撥打和接聽電話則更為常見。
HSP:耳機(jī)模式(HSP)用于支持藍(lán)牙耳機(jī)與移動(dòng)電話之間使用免提模式(HFP)常用來讓車用免提溝通與車內(nèi)移動(dòng)電話
A2DP:A2DP全名是Advanced Audio Distribution Profile 藍(lán)牙音頻傳輸模型協(xié)定! A2DP是能夠采用耳機(jī)內(nèi)的芯片來堆棧數(shù)據(jù),達(dá)到聲音的高清晰度。然而并非支持A2DP的耳機(jī)就是蘭阿姨耳機(jī)立體聲,立體聲實(shí)現(xiàn)的基本要求是雙聲道,所以單聲道的藍(lán)牙耳機(jī)是不能實(shí)現(xiàn)立體聲的。聲音能達(dá)到44.1kHz,一般的耳機(jī)只能達(dá)到8kHz。如果手機(jī)支持藍(lán)牙,只要裝載A2DP協(xié)議,就能使用A2DP耳機(jī)了。還有消費(fèi)者看到技術(shù)參數(shù)提到藍(lán)牙V1.0 V1.1 V1.2 V2.0——這些是指藍(lán)牙的技術(shù)版本,是指通過藍(lán)牙傳輸?shù)乃俣?,他們是否支持A2DP具體要看藍(lán)牙產(chǎn)品制造商是否使用這個(gè)技術(shù)。
AVRCP:AVRCP 設(shè)計(jì)用于提供控制TV、Hi-Fi設(shè)備等的標(biāo)準(zhǔn)接口。此配置文件用于許可單個(gè)遠(yuǎn)程控制設(shè)備(或其它設(shè)備)控制所有用戶可以接入的A/V設(shè)備。它可以與 A2DP 或 VDP 配合使用。AVRCP 定義了如何控制流媒體的特征。包括暫停、停止、啟動(dòng)重放、音量控制及其它類型的遠(yuǎn)程控制操作。AVRCP 定義了兩個(gè)角色,即控制器和目標(biāo)設(shè)備。
APTX:AptX是一種壓縮技術(shù),好比是ALAC,本身是支持無損的,但是被用在藍(lán)牙技術(shù)中的時(shí)候,由于種種原因,還是有損,只不過屬于比較高碼率的有損。
OPP
藍(lán)牙通信程序部分需采用用于設(shè)備之間傳輸數(shù)據(jù)對(duì)象OPP Profile: Object Push Profile由于OPP profile又細(xì)分為OPPC (client)端和OPPS(server)端profile,這兩個(gè)profile區(qū)別在于只有client端可以發(fā)起數(shù)據(jù)傳輸?shù)倪^程,但是附件設(shè)備與手機(jī)通信的情景中,既有手機(jī)發(fā)起數(shù)據(jù)傳輸請(qǐng)求也有設(shè)備側(cè)發(fā)起傳輸請(qǐng)求的需要,所以要在設(shè)備中實(shí)現(xiàn)OPPC和OPPS兩個(gè)profile。
PBAP
電話號(hào)碼簿訪問協(xié)議(Phonebook Access Profile)
會(huì)議電視常用音頻協(xié)議有哪些

1、 ITU-T G.728
1992年ITU-T發(fā)布的電話聲音信號(hào)編碼方式推薦標(biāo)準(zhǔn)。采用LD-CELP編碼方式,采樣率為8KHz,以16kb/秒的速度傳送聲音信號(hào),傳送延遲時(shí)間極短,僅有0.625 ms 的算法編碼延遲。
2、 ITU-T G.711
標(biāo)準(zhǔn)公布于1972年,其語音信號(hào)編碼是非均勻量化PCM。語音的采樣率為8KHz,每個(gè)樣值采用8bit量化,輸出的數(shù)據(jù)率為64kbps。這種窄帶編碼支持對(duì)300到 3,400赫茲的音頻進(jìn)行壓縮。但雖然壓縮質(zhì)量不錯(cuò),但是消耗的帶寬相對(duì)較大,主要用于數(shù)字PBX/ISDN上的數(shù)字式電話。
3、 ITU-T G.722
ITU-T G.722標(biāo)準(zhǔn)是第一個(gè)用于 16 KHZ 采樣率的標(biāo)準(zhǔn)化寬帶語音編碼算法,1984年被CCITT定義為標(biāo)準(zhǔn),而且現(xiàn)今還在使用。.G.722 編解碼器在 16 kHz 頻率上接收 16 位數(shù)據(jù)(帶寬從 50 Hz 至 7 kHz),并將其壓縮為 64、56 與 48 Kbit/s,其總延遲約 3 ms,能夠提供更好的通話質(zhì)量。
G.722的優(yōu)點(diǎn)是延時(shí)和傳輸位誤差率非常低,且沒有任何的專利技術(shù),費(fèi)用低廉。因此G.722在無線通信系統(tǒng),VoIP生產(chǎn)商,個(gè)人通信服務(wù),視頻會(huì)議應(yīng)用等廣泛應(yīng)用。
4、 G.722.1
G.722.1基于 Polycom 的第三代 Siren 7 壓縮技術(shù),1999年被ITU-T批準(zhǔn)為G.722.1標(biāo)準(zhǔn)。G.722.1采用16 KHZ 采樣頻率,16 位數(shù)據(jù)量化,支持從 50 Hz 至 7 kHz頻率范圍的音頻采樣,并將其壓縮為 32 與 24 Kbit/s。它采用20 ms封幀,提供40ms的算法延遲。
G722.1可實(shí)現(xiàn)比 G.722 編解碼器更低的比特率以及更大的壓縮。目標(biāo)是以大約一半的比特率實(shí)現(xiàn)與 G.722 大致相當(dāng)?shù)馁|(zhì)量。這種編碼使用許可需要獲得Polycom公司的授權(quán)。
5、 G722.1 Annex C
G722.1 Annex C基于 Polycom 的Siren 14 壓縮技術(shù), 采用32kHz采樣頻率,支持從 50 Hz 至 14 kHz頻率范圍的音頻采樣,并將其壓縮為 24、32或48 kbps。采用20ms封幀,提供40毫秒演算延遲。
2005年中,國(guó)際電信聯(lián)盟(ITU)批準(zhǔn)Polycom Siren 14? 技術(shù)為14 kHz超寬帶音頻編碼新標(biāo)準(zhǔn)。同時(shí)進(jìn)入作為ITU-T建議的G.722.1 Annex C。 G722.1 Annex C具有低運(yùn)算能力,低帶寬的優(yōu)點(diǎn)。適于處理語音、音樂與自然界聲音。
6、 AAC-LD
AAC(Advanced Audio Coding,高級(jí)音頻編碼)是由Fraunhofer研究院(MP3格式的創(chuàng)造者)、杜比(DOLBY)試驗(yàn)室和AT&T(美國(guó)電話電報(bào)公司)共同研發(fā)出的一種音頻壓縮格式,是MPEG-2規(guī)范的一部分,并在1997年3月成為國(guó)際標(biāo)準(zhǔn)。隨著MPEG-4標(biāo)準(zhǔn)在2000年成型后,MPEG2 AAC也被作為核心編碼技術(shù),并增加了一些新的編碼特性,又叫MPEG-4 AAC。
MPEG-4 AAC家族目前共有九種編碼規(guī)格,AAC-LD(Low Delay,低延遲規(guī)格)是用在低碼率下編碼。它支持8K~48K采樣率的,可以64Kbps的碼率輸出接近 CD 音質(zhì)的音頻,并支持多聲音通道,AAC-LD 算法延遲僅為 20ms。
AAC因?yàn)槠淠K化設(shè)計(jì),功能更為強(qiáng)大。本身的框架結(jié)構(gòu)能夠被不斷的新的東西填充,這就使得不同發(fā)展方面的內(nèi)核相互融合,彼此吸收精華成為可能。
7、 各種音頻協(xié)議的主要參數(shù)對(duì)比:
采樣頻率 支持音頻帶寬 輸出碼率 最低算法延遲
G711 8KHz 300 Hz ~ 3,400 Hz 64 Kbps 《1ms
G722 16kHz 50 Hz ~ 7 kHz 64 Kbps 3ms
G722.1 16kHz 50 Hz ~7 kHz 24、32 Kbps 40ms
G722.1 C 32kHz 50 Hz~14 kHz 24、32、48Kbps 40ms
AAC-LD 48kHz 20 Hz-20kHz 48~64 Kbps 20ms
三、AAC_LD與G722. Annex C優(yōu)缺點(diǎn)對(duì)比:
G722.1 C AAC_LD
采樣音頻頻率范圍支持50 Hz~14 kHz,接近CD音質(zhì),但丟失了高頻部分。
支持20 Hz-20kHz全頻段的采樣,音頻更加接近CD音質(zhì)。
輸出碼率24、32、48Kbps,帶寬低于AAC-LD,但是以犧牲高頻為代價(jià)的。
48~64 Kbps,并支持大于64Kbps的輸出,為更好的音頻質(zhì)量提供了可能。
算法復(fù)雜性算法復(fù)雜度低,CPU占用率略好于AAC-LD 模塊化設(shè)計(jì),功能更為強(qiáng)大,有TI等專用芯片支持
最低延遲采用20ms封幀,40ms算法延遲 20ms算法延遲,好于G722.1 C
多聲道可以支持雙聲道 AAC支持多達(dá)48個(gè)音軌、15個(gè)低頻音軌
標(biāo)準(zhǔn)通用性G722.1-C 由Polycom制定開發(fā),使用需要Polycom授權(quán),目前只有Polycom和極少數(shù)會(huì)議電視廠商使用。 作為MPEG4核心標(biāo)準(zhǔn),受到Apple、諾基亞、松下等支持,并被泰德等眾多會(huì)議電視廠商所采用,應(yīng)用前景更廣闊。
在相同的采樣頻率下,AAC-LD可以提供比G722.1 C、MP3等更好的音質(zhì)。AAC-LD實(shí)現(xiàn)了超寬頻音頻編碼中最短的延時(shí),并保證接近CD的音質(zhì),達(dá)到音質(zhì)、比特率和延時(shí)三者的最佳組合,是會(huì)議電視領(lǐng)域的最優(yōu)選擇。
編輯推薦:ADI公司談音頻系統(tǒng)標(biāo)準(zhǔn)和協(xié)議
音頻格式有哪些

CD
CD格式的音質(zhì)是比較高的音頻格式。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數(shù)播放軟件的“打開文件類型”中,都可以看到*.cda格式,這就是CD音軌了。標(biāo)準(zhǔn)CD格式也就是44.1K的采樣頻率,速率88K/秒,16位量化位數(shù),因?yàn)镃D音軌可以說是近似無損的,因此它的聲音基本上是忠于原聲的,因此如果你是一個(gè)音響發(fā)燒友的話,CD是你的首選。它會(huì)讓你感受到天籟之音。CD光盤可以在CD唱機(jī)中播放,也能用電腦里的各種播放軟件來重放。一個(gè)CD音頻文件是一個(gè)*.cda文件,這只是一個(gè)索引信息,并不是真正的包含聲音信息,所以不論CD音樂的長(zhǎng)短,在電腦上看到的“*.cda文件”都是44字節(jié)長(zhǎng)。注意:不能直接的復(fù)制CD格式的*.cda文件到硬盤上播放,需要使用像EAC這樣的抓音軌軟件把CD格式的文件轉(zhuǎn)換成WAV,這個(gè)轉(zhuǎn)換過程如果光盤驅(qū)動(dòng)質(zhì)量過關(guān)而且EAC的參數(shù)設(shè)置得當(dāng)?shù)脑挕?梢哉f是基本上無損抓音頻。
WAVE
WAVE(*.WAV)是微軟公司開發(fā)的一種聲音文件格式,它符合PIFFResource Interchange File Format 文件規(guī)范,用于保存WINDOWS平臺(tái)的音頻信息資源,被WINDOWS平臺(tái)及其應(yīng)用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,標(biāo)準(zhǔn)格式的WAV文件和CD格式一樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數(shù),看到了吧,WAV格式的聲音文件質(zhì)量和CD相差無幾,也是目前PC機(jī)上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認(rèn)識(shí)”WAV格式。
AIFF
?。ˋudio Interchange File Format)格式和AU格式,它們都和WAV非常相像,在大多數(shù)的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。
AIFF是音頻交換文件格式的英文縮寫。是APPLE公司開發(fā)的一種音頻文件格式,被MACINTOSH平臺(tái)及其應(yīng)用程序所支持,NETSCAPE瀏覽器中LIVEAUDIO也支持AIFF格式。所以大家都不常見。AIFF是Apple蘋果電腦上面的標(biāo)準(zhǔn)音頻格式,屬于QuickTime技術(shù)的一部分。這一格式的特點(diǎn)就是格式本身與數(shù)據(jù)的意義無關(guān),因此受到了Microsoft的青睞,并據(jù)此搞出來WAV格式。AIFF雖然是一種很優(yōu)秀的文件格式,但由于它是蘋果電腦上的格式,因此在PC平臺(tái)上并沒有得到很大的流行。不過由于Apple電腦多用于多媒體制作出版行業(yè),因此幾乎所有的音頻編輯軟件和播放軟件都或多或少地支持AIFF格式。只要蘋果電腦還在,AIFF就始終還占有一席之地。由于AIFF的包容特性,所以它支持許多壓縮技術(shù)。
AU
AUDIO文件是SUN公司推出的一種數(shù)字音頻格式。AU文件原先是UNIX操作系統(tǒng)下的數(shù)字聲音文件。由于早期INTERNET上的WEB服務(wù)器主要是基于UNIX的,所以,AU格式的文件在如今的INTERNET中也是常用的聲音文件格式。
MPEG
MPEG是動(dòng)態(tài)圖象專家組的英文縮寫。這個(gè)專家組始建于1988年,專門負(fù)責(zé)為CD建立視頻和音頻壓縮標(biāo)準(zhǔn)。MPEG音頻文件指的是MPEG標(biāo)準(zhǔn)中的聲音部分即MPEG音頻層。目前INTERNET上的音樂格式以MP3最為常見。雖然它是一種有損壓縮,但是它的最大優(yōu)勢(shì)是以極小的聲音失真換來了較高的壓縮比。MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4
MP3
MP3格式誕生于八十年代的德國(guó),所謂的MP3也就是指的是MPEG標(biāo)準(zhǔn)中的音頻部分,也就是MPEG音頻層。根據(jù)壓縮質(zhì)量和編碼處理的不同分為3層,分別對(duì)應(yīng)“*.mp1“/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大家注意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時(shí)基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質(zhì)量來換取文件的尺寸,相同長(zhǎng)度的音樂文件,用*.mp3格式來儲(chǔ)存,一般只有*.wav文件的1/10,因而音質(zhì)要次于CD格式或WAV格式的聲音文件。由于其文件尺寸小,音質(zhì)好;所以在它問世之初還沒有什么別的音頻格式可以與之匹敵,因而為*.mp3格式的發(fā)展提供了良好的條件。直到現(xiàn)在,這種格式還是很流行,作為主流音頻格式的地位難以被撼動(dòng)。但是樹大招風(fēng),MP3音樂的版權(quán)問題也一直找不到辦法解決,因?yàn)镸P3沒有版權(quán)保護(hù)技術(shù),說白了也就是誰都可以用。
MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節(jié)省空間,也可以用320Kbps的標(biāo)準(zhǔn)達(dá)到極高的音質(zhì)。用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現(xiàn)在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采樣頻率)技術(shù)可以以固定的頻率采樣一首歌曲,而VBR(可變采樣頻率)則可以在音樂“忙”的時(shí)候加大采樣的頻率獲取更高的音質(zhì),不過產(chǎn)生的MP3文件可能在某些播放器上無法播放。把VBR的級(jí)別設(shè)定成為與前面的CBR文件的音質(zhì)基本一樣,生成的VBR MP3文件為2.9MB。
MP3是到2008年止使用用戶最多的有損壓縮數(shù)字音頻格式了。它的全稱是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,剛出現(xiàn)時(shí)它的編碼技術(shù)并不完善,它更像一個(gè)編碼標(biāo)準(zhǔn)框架,留待人們?nèi)ネ晟?。早期的MP3編碼采用的的是固定編碼率的方式(CBR),看到的128Kbps,就是代表它是以128Kbps固定數(shù)據(jù)速率編碼——你可以提高這個(gè)編碼率,最高可以到320Kbps,音質(zhì)會(huì)更好,自然,文件的體積會(huì)相應(yīng)增大。
因?yàn)镸P3的編碼方式是開放的,可以在這個(gè)標(biāo)準(zhǔn)框架的基礎(chǔ)上自己選擇不同的聲學(xué)原理進(jìn)行壓縮處理,所以,很快由新公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復(fù)雜部分用高bitrate編碼,簡(jiǎn)單部分用低bitrate編碼,通過這種方式,進(jìn)一步取得質(zhì)量和體積的統(tǒng)一。當(dāng)然,早期的Xing編碼器的VBR算法很差,音質(zhì)與CBR(固定碼率)相去甚遠(yuǎn)。但是,這種算法指明了一種方向,其他開發(fā)者紛紛推出自己的VBR算法,使得效果一直在改進(jìn)。目前公認(rèn)比較好的首推LAME,它完美地實(shí)現(xiàn)了VBR算法,而且它是是完全免費(fèi)的軟件,并且由愛好者組成的開發(fā)團(tuán)隊(duì)一直在不斷的發(fā)展完善。
而在VBR的基礎(chǔ)上,LAME更加發(fā)展出ABR算法。ABR(AverageBitrate)平均比特率,是VBR的一種插值參數(shù)。LAME針對(duì)CBR不佳的文件體積比和VBR生成文件大小不定的特點(diǎn)獨(dú)創(chuàng)了這種編碼模式。ABR在指定的文件大小內(nèi),以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對(duì)低的流量,高頻和大動(dòng)態(tài)表現(xiàn)時(shí)使用高流量,可以做為VBR和CBR的一種折衷選擇。
MP3問世不久,就憑這較高的壓縮比12:1和較好的音質(zhì)創(chuàng)造了一個(gè)全新的音樂領(lǐng)域,然而MP3的開放性卻最終不可避免的導(dǎo)致了版權(quán)之爭(zhēng),在這樣的背景之下,文件更小,音質(zhì)更佳,同時(shí)還能有效保護(hù)版權(quán)的MP4就應(yīng)運(yùn)而生了。MP3和MP4之間其實(shí)并沒有必然的聯(lián)系,首先MP3是一種音頻壓縮的國(guó)際技術(shù)標(biāo)準(zhǔn),而MP4卻是一個(gè)商標(biāo)的名稱。
MPEG-4
MPEG-4標(biāo)準(zhǔn)是由國(guó)際運(yùn)動(dòng)圖像專家組于2000年10月公布的一種面向多媒體應(yīng)用的視頻壓縮標(biāo)準(zhǔn)。它采用了基于對(duì)象的壓縮編碼技術(shù),在編碼前首先對(duì)視頻序列進(jìn)行分析,從原始圖像中分割出各個(gè)視頻對(duì)象,然后再分別對(duì)每個(gè)視頻對(duì)象的形狀信息、運(yùn)動(dòng)信息、紋理信息單獨(dú)編碼,并通過比MPEG-2更優(yōu)的運(yùn)動(dòng)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償來去除連續(xù)幀之間的時(shí)間冗余。其核心是基于內(nèi)容的尺度可變性(Content-basedscalability),可以對(duì)圖像中各個(gè)對(duì)象分配優(yōu)先級(jí),對(duì)比較重要的對(duì)象用高的空間和時(shí)間分辨率表示,對(duì)不甚重要的對(duì)象(如監(jiān)控系統(tǒng)的背景)以較低的分辨率表示,甚至不顯示。因此它具有自適應(yīng)調(diào)配資源能力,可以實(shí)現(xiàn)高質(zhì)量低速率的圖像通信和視頻傳輸。 MPEG-4以其高質(zhì)量、低傳輸速率等優(yōu)點(diǎn)已經(jīng)被廣泛應(yīng)用到網(wǎng)絡(luò)多媒體、視頻會(huì)議和多媒體監(jiān)控等圖像傳輸系統(tǒng)中。中國(guó)內(nèi)外大部分成熟的MPEG-4應(yīng)用均為基于PC層面的客戶端和服務(wù)器模式,應(yīng)用在嵌入式上的并不多,且多數(shù)嵌入式MPEG-4解碼系統(tǒng)大多使用商業(yè)的嵌入式操作系統(tǒng),如WindowsCE、VxWorks等,成本高、靈活性差。如以嵌入式Linux作為操作系統(tǒng)不僅開發(fā)方便,且可以節(jié)約成本,并可以根據(jù)實(shí)際情況進(jìn)行裁減,占用資源少、靈活性強(qiáng),網(wǎng)絡(luò)性能好,適用范圍更廣。
MIDI
MIDI(Musical Instrument Digital Interface)格式被經(jīng)常玩音樂的人使用,MIDI允許數(shù)字合成器和其他設(shè)備交換數(shù)據(jù)。MID文件格式由MIDI繼承而來。MID文件并不是一段錄制好的聲音,而是記錄聲音的信息,然后再告訴聲卡如何再現(xiàn)音樂的一組指令。這樣一個(gè)MIDI文件每存1分鐘的音樂只用大約5~10KB。MID文件主要用于原始樂器作品,流行歌曲的業(yè)余表演,游戲音軌以及電子賀卡等。*.mid文件重放的效果完全依賴聲卡的檔次。*.mid格式的最大用處是在電腦作曲領(lǐng)域。*.mid文件可以用作曲軟件寫出,也可以通過聲卡的MIDI口把外接音序器演奏的樂曲輸入電腦里,制成*.mid文件。
WMA
WMA (Windows Media Audio) 格式是來自于微軟的重量級(jí)選手,后臺(tái)強(qiáng)硬,音質(zhì)要強(qiáng)于MP3格式,更遠(yuǎn)勝于RA格式,它和日本YAMAHA公司開發(fā)的VQF格式一樣,是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達(dá)到1:18左右,WMA的另一個(gè)優(yōu)點(diǎn)是內(nèi)容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護(hù)。這種內(nèi)置了版權(quán)保護(hù)技術(shù)可以限制播放時(shí)間和播放次數(shù)甚至于播放的機(jī)器等等,這對(duì)被盜版攪得焦頭爛額的音樂公司來說可是一個(gè)福音,另外WMA還支持音頻流(Stream)技術(shù),適合在網(wǎng)絡(luò)上在線播放,作為微軟搶占網(wǎng)絡(luò)音樂的開路先鋒可以說是技術(shù)領(lǐng)先、風(fēng)頭強(qiáng)勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統(tǒng)和Windows Media Player的無縫捆綁讓你只要安裝了windows操作系統(tǒng)就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光盤轉(zhuǎn)換為WMA聲音格式的功能,在新出品的操作系統(tǒng)Windows XP中,WMA是默認(rèn)的編碼格式,大家知道Netscape的遭遇,現(xiàn)在“狼”又來了。WMA這種格式在錄制時(shí)可以對(duì)音質(zhì)進(jìn)行調(diào)節(jié)。同一格式,音質(zhì)好的可與CD媲美,壓縮率較高的可用于網(wǎng)絡(luò)廣播。雖然現(xiàn)在網(wǎng)絡(luò)上還不是很流行,但是在微軟的大規(guī)模推廣下已經(jīng)是得到了越來越多站點(diǎn)的承認(rèn)和大力支持,在網(wǎng)絡(luò)音樂領(lǐng)域中直逼*.mp3,在網(wǎng)絡(luò)廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。
微軟官方宣布的資料中稱WMA格式的可保護(hù)性極強(qiáng),甚至可以限定播放機(jī)器、播放時(shí)間及播放次數(shù),具有相當(dāng)?shù)陌鏅?quán)保護(hù)能力。應(yīng)該說,WMA的推出,就是針對(duì)MP3沒有版權(quán)限制的缺點(diǎn)而來——普通用戶可能很歡迎這種格式,但作為版權(quán)擁有者的唱片公司來說,它們更喜歡難以復(fù)制拷貝的音樂壓縮技術(shù),而微軟的WMA則照顧到了這些唱片公司的需求。
除了版權(quán)保護(hù)外,WMA還在壓縮比上進(jìn)行了深化,它的目標(biāo)是在相同音質(zhì)條件下文件體積可以變的更?。ó?dāng)然,只在MP3低于192KBPS碼率的情況下有效,實(shí)際上當(dāng)采用LAME算法壓縮MP3格式時(shí),高于192KBPS時(shí)普遍的反映是MP3的音質(zhì)要好于WMA)。
RealAudio
RealAudio主要適用于在網(wǎng)絡(luò)上的在線音
樂欣賞,現(xiàn)在大多數(shù)的用戶仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音質(zhì)。有的下載站點(diǎn)會(huì)提示你根據(jù)你的Modem速率選擇最佳的Real文件。real的的文件格式主要有這么幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點(diǎn)是可以隨網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質(zhì)。
近來隨著網(wǎng)絡(luò)寬帶的普遍改善,Real公司正推出用于網(wǎng)絡(luò)廣播、達(dá)到CD音質(zhì)的格式。如果你的軟件不能處理RealPlayer這種格式,它就會(huì)提醒你下載一個(gè)免費(fèi)的升級(jí)包。許多音樂網(wǎng)站 提供了歌曲的Real格式的試聽版本?,F(xiàn)在最新的版本是RealPlayer 9.0,第39期《電腦報(bào)》也對(duì)RealPlayer 9.0作了詳細(xì)的介紹,這里不再贅述。
VQF
雅馬哈公司另一種格式是*.vqf,它的核心是減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到更高的壓縮比,VQF的音頻壓縮率比標(biāo)準(zhǔn)的MPEG音頻壓縮率高出近一倍,可以達(dá)到18:1左右甚至更高。也就是說把一首4分鐘的歌曲(WAV文件)壓成MP3,大約需要4MB左右的硬盤空間,而同一首歌曲,如果使用VQF音頻壓縮技術(shù)的話,那只需要2MB左右的硬盤空間。因此,在音頻壓縮率方面,MP3和RA都不是VQF的對(duì)手。相同情況下壓縮后VQF的文件體積比MP3小30%~50%,更便利于網(wǎng)上傳播,同時(shí)音質(zhì)極佳,接近CD音質(zhì)(16位44.1kHz立體聲)??梢哉f技術(shù)上也是很先進(jìn)的,但是由于宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時(shí)雅馬哈也提供從*.wav文件轉(zhuǎn)換到*.vqf文件的軟件。 此文件缺少特點(diǎn)外加缺乏宣傳。
當(dāng)VQF以44KHz、80kbit/s的音頻采樣率壓縮音樂時(shí),它的音質(zhì)優(yōu)于44KHz、128kbit/s的MP3,當(dāng)VQF以44KHz、96kbit/s的頻率壓縮時(shí),它的音質(zhì)幾乎等于44KHz、256kbit/s的MP3。經(jīng)SoundVQ壓縮后的音頻文件在進(jìn)行回放效果試聽時(shí),幾乎沒有人能聽出它與原音頻文件的差異。
播放VQF對(duì)計(jì)算機(jī)的配置要求僅為奔騰75或更高,當(dāng)然如果您用奔騰100或以上的機(jī)器,VQF能夠運(yùn)行得更加出色。實(shí)際上,播放VQF對(duì)CPU的要求僅比Mp3高5~10%左右。
VQF即TwinVQ技術(shù)雖然是由NTT和YAMAHA開發(fā)的,但它們的應(yīng)用軟件都是免費(fèi)的。只是NTT和YAMAHA并沒有公布VQF的源代碼。
OggVorbis
OggVorbis是一種新的音頻壓縮格式,類似于MP3等現(xiàn)有的音樂格式。但有一點(diǎn)不同的是,它是完全免費(fèi)、開放和沒有專利限制的。Vorbis是這種音頻壓縮機(jī)制的名字,而Ogg則是一個(gè)計(jì)劃的名字,該計(jì)劃意圖設(shè)計(jì)一個(gè)完全開放性的多媒體系統(tǒng)。目前該計(jì)劃只實(shí)現(xiàn)了OggVorbis這一部分。
OggVorbis文件的擴(kuò)展名是*.OGG。這種文件的設(shè)計(jì)格式是非常先進(jìn)的。這種文件格式可以不斷地進(jìn)行大小和音質(zhì)的改良,而不影響舊有的編碼器或播放器。
VORBIS采用有損壓縮,但通過使用更加先進(jìn)的聲學(xué)模型去減少損失,因此,同樣位速率(BitRate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個(gè)原因,MP3格式是受專利保護(hù)的。如果你想使用MP3格式發(fā)布自己的作品,則需要付給Fraunhofer(發(fā)明MP3的公司)專利使用費(fèi)。而VORBIS就完全沒有這個(gè)問題。
對(duì)于樂迷來說,使用OGG文件的顯著好處是可以用更小的文件獲得優(yōu)越的聲音質(zhì)量。而且,由于OGG是完全開放和免費(fèi)的,制作OGG文件將不受任何專利限制,可望可以獲得大量的編碼器和播放器。這也是為何現(xiàn)在MP3編碼器如此少而且大多是商業(yè)軟件的原因,因?yàn)镕raunhofer要收取專利使用費(fèi)。Vorbis使用了與MP3相比完全不同的數(shù)學(xué)原理,因此在壓縮音樂時(shí)受到的挑戰(zhàn)也不同。同樣位速率編碼的Vorbis和MP3文件具有同等的音樂質(zhì)量。Vorbis具有一個(gè)設(shè)計(jì)良好、靈活的注釋,避免了象MP3文件的ID3標(biāo)記那樣煩瑣的操作;Vorbis還具有位速率縮放:可以不用重新編碼便可調(diào)節(jié)文件的位速率。Vorbis文件可以被分成小塊并以樣本粒度進(jìn)行編輯;Vorbis支持多通道;Vorbis文件可以以邏輯方式相連接等。
AMR
AMR全稱Adaptive Multi-Rate,自適應(yīng)多速率編碼,主要用于移動(dòng)設(shè)備的音頻,壓縮比比較大,但相對(duì)其他的壓縮格式質(zhì)量比較差,由于多用于人聲,通話,效果還是很不錯(cuò)的。
分類
1. AMR: 又稱為AMR-NB,相對(duì)于下面的WB而言,語音寬帶范圍:300-3400Hz,8KHz抽樣
2. AMR-WB:AMR WideBand,
語音寬帶范圍: 50-7000Hz 16KHz抽樣
“AMR-WB”全稱為“Adaptive Multi-rate - Wideband”,即“自適應(yīng)多速率寬帶編碼”,采樣頻率為16kHz,是一種同時(shí)被國(guó)際標(biāo)準(zhǔn)化組織ITU-T和3GPP采用的寬帶語音編碼標(biāo)準(zhǔn),也稱為G722.2標(biāo)準(zhǔn)。AMR-WB提供語音帶寬范圍達(dá)到50~7000Hz,用戶可主觀感受到話音比以前更加自然、舒適和易于分辨。
與之作比較,現(xiàn)在GSM用的EFR(Enhenced Full Rate,增強(qiáng)型全速率編碼)采樣頻率為8kHz,語音帶寬為200~3400Hz。
AMR-WB應(yīng)用于窄帶GSM(全速信道16k,GMSK)的優(yōu)勢(shì)在于其可采用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當(dāng)網(wǎng)絡(luò)繁忙時(shí)C/I惡化,編碼器可以自動(dòng)調(diào)整編碼模式,從而增強(qiáng)QoS。在這種應(yīng)用中,AMR-WB抗擾度優(yōu)于AMR-NB。
AMR-WB應(yīng)用于EDGE、3G可充分體現(xiàn)其優(yōu)勢(shì)。足夠的傳輸寬帶保證AMR-WB可采用從 6.6kb/s到23.85kb/s共九種編碼,語音質(zhì)量超越PSTN固定電話。
作為數(shù)字音樂文件格式的標(biāo)準(zhǔn),WAV格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或WMA格式。壓縮方法有無損壓縮,有損壓縮,以及混成壓縮。MPEG,JPEG就屬于混成壓縮,如果把壓縮的數(shù)據(jù)還原回去,數(shù)據(jù)其實(shí)是不一樣的。當(dāng)然,人耳是無法分辨的。因此,如果把MP3,OGG格式從壓縮的狀態(tài)還原回去的話,就會(huì)產(chǎn)生損失。然而,APE格式即使還原,也能毫無損失地保留原有音質(zhì)。所以,APE可以無損失高音質(zhì)地壓縮和還原。在完全保持音質(zhì)的前提下,APE的壓縮容量有了適當(dāng)?shù)臏p小。拿一個(gè)最為常見的38MBWAV文件為例,壓縮為APE格式后為25MB左右,比開始足足少了13MB。而且MP3容量越來越大的今天,25M的歌曲已經(jīng)算不上什么龐然大物了。以1GB的mp3來說可以放入4張CD,那就是40多首歌曲,已經(jīng)足夠了!
MP3支持格式有MP3和WMA。MP3由于是有損壓縮,因此講求采樣率,一般是44.1KHZ。另外,還有比特率,即數(shù)據(jù)流,一般為8---320KBPS。在MP3編碼時(shí),還看看它是否支持可變比特率(VBR),現(xiàn)在出的MP3機(jī)大部分都支持,這樣可以減小有效文件的體積。WMA則是微軟力推的一種音頻格式,相對(duì)來說要比MP3體積更小。
評(píng)論