西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
軟件
軟件
文章
搜索

首頁(yè)西西教程其它教程 → 音頻編碼知識(shí)、MP3編碼知識(shí) MP3音頻編碼的優(yōu)點(diǎn)

音頻編碼知識(shí)、MP3編碼知識(shí) MP3音頻編碼的優(yōu)點(diǎn)

相關(guān)軟件相關(guān)文章發(fā)表評(píng)論 來(lái)源:西西整理時(shí)間:2011/7/13 11:10:12字體大。A-A+

作者:西西點(diǎn)擊:394次評(píng)論:0次標(biāo)簽: MP3

  • 類型:文學(xué)作品大小:187.2M語(yǔ)言:中文 評(píng)分:2.1
  • 標(biāo)簽:
立即下載

 音頻編碼知識(shí)
自然界中的聲音非常復(fù)雜,波形極其復(fù)雜,通常我們采用的是脈沖代碼調(diào)制編碼,即PCM編碼。PCM通過(guò)抽樣、量化、編碼三個(gè)步驟將連續(xù)變化的模擬信號(hào)轉(zhuǎn)換為數(shù)字編碼。

1-1 什么是采樣率和采樣大小(位/bit)。
聲音其實(shí)是一種能量波,因此也有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線,振幅對(duì)應(yīng)于電平軸線。波是無(wú)限光滑的,弦線可以看成由無(wú)數(shù)點(diǎn)組成,由于存儲(chǔ)空間是相對(duì)有限的,數(shù)字編碼過(guò)程中,必須對(duì)弦線的點(diǎn)進(jìn)行采樣。采樣的過(guò)程就是抽取某點(diǎn)的頻率值,很顯然,在一秒中內(nèi)抽取的點(diǎn)越多,獲取得頻率信息更豐富,為了復(fù)原波形,一次振動(dòng)中,必須有2個(gè)點(diǎn)的采樣,人耳能夠感覺(jué)到的最高頻率為20kHz,因此要滿足人耳的聽(tīng)覺(jué)要求,則需要至少每秒進(jìn)行40k次采樣,用40kHz表達(dá),這個(gè)40kHz就是采樣率。我們常見(jiàn)的CD,采樣率為44.1kHz。光有頻率信息是不夠的,我們還必須獲得該頻率的能量值并量化,用于表示信號(hào)強(qiáng)度。量化電平數(shù)為2的整數(shù)次冪,我們常見(jiàn)的CD位16bit的采樣大小,即2的16次方。采樣大小相對(duì)采樣率更難理解,因?yàn)橐@得抽象點(diǎn),舉個(gè)簡(jiǎn)單例子:假設(shè)對(duì)一個(gè)波進(jìn)行8次采樣,采樣點(diǎn)分別對(duì)應(yīng)的能量值分別為A1-A8,但我們只使用2bit的采樣大小,結(jié)果我們只能保留A1-A8中4個(gè)點(diǎn)的值而舍棄另外4個(gè)。如果我們進(jìn)行3bit的采樣大小,則剛好記錄下8個(gè)點(diǎn)的所有信息。采樣率和采樣大小的值越大,記錄的波形更接近原始信號(hào)。

1-2 有損和無(wú)損
根據(jù)采樣率和采樣大小可以得知,相對(duì)自然界的信號(hào),音頻編碼最多只能做到無(wú)限接近,至少目前的技術(shù)只能這樣了,相對(duì)自然界的信號(hào),任何數(shù)字音頻編碼方案都是有損的,因?yàn)闊o(wú)法完全還原。在計(jì)算機(jī)應(yīng)用中,能夠達(dá)到最高保真水平的就是PCM編碼,被廣泛用于素材保存及音樂(lè)欣賞,CD、DVD以及我們常見(jiàn)的WAV文件中均有應(yīng)用。因此,PCM約定俗成了無(wú)損編碼,因?yàn)镻CM代表了數(shù)字音頻中最佳的保真水準(zhǔn),并不意味著PCM就能夠確保信號(hào)絕對(duì)保真,PCM也只能做到最大程度的無(wú)限接近。我們而習(xí)慣性的把MP3列入有損音頻編碼范疇,是相對(duì)PCM編碼的。強(qiáng)調(diào)編碼的相對(duì)性的有損和無(wú)損,是為了告訴大家,要做到真正的無(wú)損是困難的,就像用數(shù)字去表達(dá)圓周率,不管精度多高,也只是無(wú)限接近,而不是真正等于圓周率的值。

1-3 為什么要使用音頻壓縮技術(shù)
要算一個(gè)PCM音頻流的碼率是一件很輕松的事情,采樣率值×采樣大小值×聲道數(shù) bps。一個(gè)采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的WAV文件,它的數(shù)據(jù)速率則為 44.1K×16×2 = 1411.2 Kbps。我們常說(shuō)128K的MP3,對(duì)應(yīng)的WAV的參數(shù),就是這個(gè)1411.2 Kbps,這個(gè)參數(shù)也被稱為數(shù)據(jù)帶寬,它和ADSL中的帶寬是一個(gè)概念。將碼率除以8,就可以得到這個(gè)WAV的數(shù)據(jù)速率,即176.4KB/s。這表示存儲(chǔ)一秒鐘采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的音頻信號(hào),需要176.4KB的空間,1分鐘則約為10.34M,這對(duì)大部分用戶是不可接受的,尤其是喜歡在電腦上聽(tīng)音樂(lè)的朋友,要降低磁盤占用,只有2種方法,降低采樣指標(biāo)或者壓縮。降低指標(biāo)是不可取的,因此專家們研發(fā)了各種壓縮方案。由于用途和針對(duì)的目標(biāo)市場(chǎng)不一樣,各種音頻壓縮編碼所達(dá)到的音質(zhì)和壓縮比都不一樣,在后面的文章中我們都會(huì)一一提到。有一點(diǎn)是可以肯定的,他們都?jí)嚎s過(guò)。< /FONT >

1-4 頻率與采樣率的關(guān)系
采樣率表示了每秒對(duì)原始信號(hào)采樣的次數(shù),我們常見(jiàn)到的音頻文件采樣率多為44.1KHz,這意味著什么呢?假設(shè)我們有2段正弦波信號(hào),分別為20Hz和20KHz,長(zhǎng)度均為一秒鐘,以對(duì)應(yīng)我們能聽(tīng)到的最低頻和最高頻,分別對(duì)這兩段信號(hào)進(jìn)行40KHz的采樣,我們可以得到一個(gè)什么樣的結(jié)果呢?結(jié)果是:20Hz的信號(hào)每次振動(dòng)被采樣了40K/20=2000次,而20K的信號(hào)每次振動(dòng)只有2次采樣。顯然,在相同的采樣率下,記錄低頻的信息遠(yuǎn)比高頻的詳細(xì)。這也是為什么有些音響發(fā)燒友指責(zé)CD有數(shù)碼聲不夠真實(shí)的原因,CD的44.1KHz采樣也無(wú)法保證高頻信號(hào)被較好記錄。要較好的記錄高頻信號(hào),看來(lái)需要更高的采樣率,于是有些朋友在捕捉CD音軌的時(shí)候使用48KHz的采樣率,這是不可取的!這其實(shí)對(duì)音質(zhì)沒(méi)有任何好處,對(duì)抓軌軟件來(lái)說(shuō),保持和CD提供的44.1KHz一樣的采樣率才是最佳音質(zhì)的保證之一,而不是去提高它。較高的采樣率只有相對(duì)模擬信號(hào)的時(shí)候才有用,如果被采樣的信號(hào)是數(shù)字的,請(qǐng)不要去嘗試提高采樣率。



MP3的編碼方式介紹

第一種就是傳統(tǒng)的CBR(Constents BitRate)。就是靜態(tài)比特率。
CBR約定死了MP3的采樣率為固定值。一首MP3從頭至尾為某固定值如KBit/s進(jìn)行壓縮如果這種壓制模式在固定比特率下如(K)復(fù)雜段落音頻是無(wú)法滿足,而低頻下又是浪費(fèi)容量。在容量一定的情況下,音質(zhì)的表現(xiàn)只能說(shuō)是差強(qiáng)人意。想要音質(zhì)到達(dá)最好。也只能把它壓成K,然而容量實(shí)在是不能讓人接受。特別是那些擁有容量較少的MP3隨身聽(tīng)但又想要高品質(zhì)MP3的朋友。用起來(lái)確實(shí)是左右為難啊。


第二種是VBR:全稱是Variable BitRate,就是動(dòng)態(tài)比特率。
就是在音頻中找出與音頻最適合的比特率進(jìn)行壓制,使其在控制容量大小的情況下把音質(zhì)提到最佳。VBR采取了一種全新的,全程動(dòng)態(tài)調(diào)節(jié)技術(shù)的壓縮方法。當(dāng)在低頻或無(wú)頻段時(shí),VBR會(huì)自動(dòng)采用的比特率如KBit/s對(duì)音質(zhì)進(jìn)行壓縮;當(dāng)在高音段時(shí)會(huì)用較高的比特率如KBit/s或KBit/s對(duì)音質(zhì)進(jìn)行壓縮;當(dāng)在級(jí)高端時(shí)則采用最高KBit/s進(jìn)行壓縮。VBR MP3就是在控制文件大小的情況下,最大限度的提高了MP3的音質(zhì),


第三種就是ABR:就是平均動(dòng)態(tài)比特率。
指定VBR控制在某個(gè)比特率然后利用VBR對(duì)音頻的解析調(diào)解MP3大小。是人們想在控制MP3容量在一定的情況下,又想要追求音質(zhì)的一種壓制方法。

就是在VBR中固定一個(gè)碼率標(biāo)準(zhǔn)。比如把VBR平均控制在Kbps的標(biāo)準(zhǔn)上讓VBR根據(jù)音頻調(diào)節(jié)VBR碼率,雖然后面得出的音樂(lè)體積比較統(tǒng)一,而音樂(lè)質(zhì)量就參差不齊。

誤區(qū):VBR比特率越高等于音質(zhì)越好,理論上是這樣,但是VBR本身的作用就是調(diào)節(jié)比特率,比特率的高低要取決于歌曲本身音源的質(zhì)量或復(fù)雜程度,

由于不同歌曲本身幀數(shù)的區(qū)別,VBR在壓縮的時(shí)候會(huì)根據(jù)歌曲自動(dòng)調(diào)節(jié)幀數(shù),一首歌曲被分為上千幀進(jìn)行分析壓制,最后得出的平均數(shù)為最后的比特率。

所以VBR壓制的MP3的音質(zhì)是不能從比特率的高低上分辨出來(lái)的。這就是我們經(jīng)常看到比特率偶爾不會(huì)是整數(shù)的原因了。(一般正版CD壓出來(lái)的最后比特率都比較高,一般都會(huì)超過(guò)K,那是正版CD在音質(zhì)的音頻質(zhì)量都要求的很高)



MP3—優(yōu)秀成熟的音頻編碼

特點(diǎn):音質(zhì)好,壓縮比比較高,被大量軟件和硬件支持,應(yīng)用廣泛。

適用于:適合用于比較高要求的音樂(lè)欣賞。


MP3作為目前最為普及的音頻壓縮格式,為大家所大量接受,各種與MP3相關(guān)的軟件產(chǎn)品層出不窮,而且更多的硬件產(chǎn)品也開(kāi)始支持MP3,我們能夠買到的VCD/DVD播放機(jī)都很多都能夠支持MP3,還有更多的便攜的MP3播放器等等,雖然幾大音樂(lè)商極其反感這種開(kāi)放的格式,但也無(wú)法阻止這種音頻壓縮的格式的生存與流傳。MP3發(fā)展已經(jīng)有10個(gè)年頭了,他是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3的簡(jiǎn)稱,是MPEG1的衍生編碼方案,1993年由德國(guó)Fraunhofer IIS研究院和湯姆生公司合作發(fā)展成功。MP3可以做到12:1的驚人壓縮比并保持基本可聽(tīng)的音質(zhì),在當(dāng)年硬盤天價(jià)的日子里,MP3迅速被用戶接受,隨著網(wǎng)絡(luò)的普及,MP3被數(shù)以億計(jì)的用戶接受。MP3編碼技術(shù)的發(fā)布之初其實(shí)是非常不完善的,由于缺乏對(duì)聲音和人耳聽(tīng)覺(jué)的研究,早期的mp3編碼器幾乎全是以粗暴方式來(lái)編碼,音質(zhì)破壞嚴(yán)重。隨著新技術(shù)的不斷導(dǎo)入,mp3編碼技術(shù)一次一次的被改良,其中有2次重大技術(shù)上的改進(jìn)。


VBR:MP3格式的文件有一個(gè)有意思的特征,就是可以邊讀邊放,這也符合流媒體的最基本特征。也就是說(shuō)播放器可以不用預(yù)讀文件的全部?jī)?nèi)容就可以播放,讀到哪里播放到哪里,即使是文件有部分損壞。雖然mp3可以有文件頭,但對(duì)于mp3格式的文件卻不是很重要,正因?yàn)檫@種特性,決定了MP3文件的每一段每一幀都可以單獨(dú)的平均數(shù)據(jù)速率,而無(wú)需特別的解碼方案。于是出現(xiàn)了一種叫VBR(Variable bitrate,動(dòng)態(tài)數(shù)據(jù)速率)的技術(shù),可以讓MP3文件的每一段甚至每一幀都可以有單獨(dú)的bitrate,這樣做的好處就是在保證音質(zhì)的前提下最大程度的限制了文件的大小。這種技術(shù)的優(yōu)越性是顯而易見(jiàn)的,但要運(yùn)用確實(shí)是一件難事,因?yàn)檫@要求編碼器知道如何為每一段分配bitrate,這對(duì)沒(méi)有波形分析的編碼器而言,這種技術(shù)如同虛設(shè)。正是如此,VBR技術(shù)并沒(méi)有一出現(xiàn)就顯得光彩奪目。


聽(tīng)覺(jué)模型的導(dǎo)入:專家們通過(guò)長(zhǎng)期的聲學(xué)研究,發(fā)現(xiàn)人耳存在遮蔽效應(yīng)。聲音信號(hào)實(shí)際是一種能量波,在空氣或其他媒介中傳播,人耳對(duì)聲音能量的多少即響度或聲壓最直接的反應(yīng)就是聽(tīng)到這個(gè)聲音的大小,我們稱它為響度,表示響度這種能量的單位為分貝(dB)。即使是同樣響度的聲音,人們也會(huì)因?yàn)樗鼈冾l率不同而感覺(jué)到聲音大小不同。人耳最容易聽(tīng)到的就是4000Hz的頻率,不管頻率是否增高或降低,即使是響度在相同的情況下,大家都會(huì)覺(jué)得聲音在變小。但響度降到一定程度時(shí),人耳就聽(tīng)不到了,每一個(gè)頻率都有著不同的值。

    相關(guān)評(píng)論

    閱讀本文后您有什么感想? 已有人給出評(píng)價(jià)!

    • 8 喜歡喜歡
    • 3 頂
    • 1 難過(guò)難過(guò)
    • 5 囧
    • 3 圍觀圍觀
    • 2 無(wú)聊無(wú)聊

    熱門評(píng)論

    最新評(píng)論

    發(fā)表評(píng)論 查看所有評(píng)論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過(guò)審核才能顯示)