|
多媒體測試庫建設(shè)之音頻部分 收藏
多媒體 測試庫建設(shè) 之音頻 部分 最近要為公司寫多媒體式樣書,并建立一個多媒體測試庫,說實話以前一直做codec,卻從沒有寫過對整個一個產(chǎn)品的式樣書,也不知道是否符合標(biāo)準(zhǔn)規(guī)范,現(xiàn)在把一些操作過程記錄下來,如果有高人覺得不適合或者有誤的地方,還請多指點~~ 先說明一下我壓制測試文件 選擇編碼器的標(biāo)準(zhǔn):如果有官方提供的標(biāo)準(zhǔn)編碼器,就使用標(biāo)準(zhǔn)的編碼器,如果沒有就使用現(xiàn)在在壓制音視頻上比較廣泛使用的codec。 1、AMR
對MID而言,AMR的要求并不是很高,因為AMR作為人聲編解碼相對來說復(fù)雜度較低,沒有太多復(fù)雜而龐大的計算,所以AMR暫時就不作測試要求了,使用google 本身提供的codec就可以了。 2、MP3
現(xiàn)在比較廣泛使用的還是mpeg-1 layer |/II/III,在實際使用過程中發(fā)現(xiàn)mpeg-2 layer |/II/III還比較廣泛地作為著mp4,3gp的音頻壓縮格式,因此必須提供對mpeg-2的支持。對mpeg-1 layer ||/|||我使用的是開源的編碼器lame,對mpeg-2 layer ||/|||也是使用的開源編碼器twolame。另外所有的音頻源都是使用Audacity從FLAC文件中取得的,在重新采用和還原raw數(shù)據(jù)上我還使用了sox。 基本上整個編碼過程沒有朋到什么問題,頭一次使用sox和Audacity,沒想到linux 還有這么強大的音頻處理工具~~值得推薦。 3、AAC
對 AAC現(xiàn)在覺得只需要考慮對MPEG-4 AAC的支持,MPEG-2 AAC暫時不在考慮范圍之內(nèi)。在MID上必須支持AAC的全部3個profile : LC /HE /HEv2 。這里的編碼器選擇一般有兩個:Nero AAC和Faac。Faac只支持LC,雖然介紹上說還支持main,LTP等編碼模式,但在實際使用過程中發(fā)現(xiàn)好像并不支持。因此這次壓制的文件都是使用的Nero AAC,另外發(fā)現(xiàn)Nero AAC對于一些非工程規(guī)范的采用率好像不支持,因此在提供源數(shù)據(jù) 的時候盡量是標(biāo)準(zhǔn)工程采樣的數(shù)據(jù)。 4、wma/real audio/ac-3/dts
對這些的支持,我都是根據(jù)wiki以及官方協(xié)議 的版本來寫的式樣書,現(xiàn)在還沒有制作相關(guān)的測試文件 mp3 簡介:
1、我們熟悉的MP3的全稱是MPEG-1 Audio Layer III ,是一種有損音頻編碼格式,屬于MPEG-1 Audio部分。 2、實際上MPEG-1在Audio部分包含三個版本,分別是Audio Layer I/II/III ; Layer I已經(jīng)基本過時不用了,現(xiàn)在使用得比較多的是Layer II 和 Layer III, Layer II現(xiàn)在主要用在廣播上面,我們熟悉的VCD實際上也是采用的這種音頻編碼方式,而Layer III現(xiàn)在則廣泛應(yīng)用 在各方面。 3、另外MPEG-2對MPEG-1 Audio進(jìn)行了擴(kuò)展,這就是我們現(xiàn)在熟知的MPEG-2 Layer I/II/III, MPEG-2廣泛用在數(shù)字電視信號傳輸,衛(wèi)星廣播等各方面 ,我們熟知的DVD也是采用了MPEG-2的音視頻編碼方式。 4、還有一種MPEG-2.5,這只是一種私有格式,用得很少,提供了很高的壓縮率。 相關(guān)參數(shù):
MPEG-1 Layer I is defined in ISO/IEC 11172-3, which first version was published in 1993. * Sampling rates: 32, 44.1 and 48 kHz
* Bitrates: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 and 448 kbit/s An extension has been provided in MPEG-2 Layer I and is defined in ISO/IEC 13818-3, which first version was published in 1995.
* Additional sampling rates: 16, 22.05 and 24 kHz
* Additional bitrates: 48, 56, 80, 112, 144 and 176 kbit/s MPEG-1 Layer II is defined in ISO/IEC 11172-3
* Sampling rates: 32, 44.1 and 48 kHz
* Bitrates: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 and 384 kbit/s An extension has been provided in MPEG-2 Layer II and is defined in ISO/IEC 13818-3
* Additional sampling rates: 16, 22.05 and 24 kHz
* Additional bitrates: 8, 16, 24, 40 and 144 kbit/s MPEG-1 layer III sample frequencies (kHz): 32 48 44.1
bitrates (kbps): 32 40 48 56 64 80 96 112 128 160 192 224 256 320 MPEG-2 layer III sample frequencies (kHz): 16 24 22.05
bitrates (kbps): 8 16 24 32 40 48 56 64 80 96 112 128 144 160 MPEG-2.5 layer III sample frequencies (kHz): 8 12 11.025
bitrates (kbps): 8 16 24 32 40 48 56 64 常見名詞:
VBR : Variable Bitrate Bit率是可變的 CBR : Constant Bitrate Bit率是固定的 ABR : Average Bitrate 平均Bit率,這是MP3的3種編碼的比特率模式 mono :單聲道
Dual channel : 雙聲道,每個聲道是比特率的一半,雙聲道不一定是立體聲 。 Stereo : 立體聲,包括兩個和兩個以上的聲道,每個聲道的碼率根據(jù)它所承載的信息量而定 Joint Stereo : 立體聲編碼的一種實現(xiàn)方式 Surround Audio : 環(huán)繞立體聲,一般包含六個以上的聲道 Sample Rate : 聲音編碼時候的采樣率,一般用Hz或者KHz為單位,即每秒里面采樣的Sample數(shù)
Sample Size : 每個采樣的深度,即每個采樣的bit數(shù) Data encoding : 編碼以后的bit流順序,經(jīng)常用到的是floating-point BitRate :這個是上面的這些參數(shù)的一個綜合反應(yīng),即每秒的bit數(shù) Moving Picture Experts Group (acronym:MPEG) was formed by the ISO to set standards for audio and video compression and transmission
AAC簡介 1、AAC全稱Advanced Audio Coding,是一種有損的音頻編碼格式,更高范圍的采樣率(8khz-96khz)以及多音軌(up to 48)以及高性能的編碼效率,被譽為mp3的繼任者。
2、AAC的基礎(chǔ) 成形于MPEG-2 AAC,MPEG-4在MPEG-2的基礎(chǔ)上加入一些新的特性(比如SBR),就形成了MPEG-4的音頻標(biāo)準(zhǔn),定義為 MPEG-4 part3,我們一般所說的AAC,都是指MPEG-4 AAC。 3、AAC有3個標(biāo)準(zhǔn),分別是LC[Low Complexity],He[high efficiency](add SBR),HeV2(add SBR and PS)。LC是基礎(chǔ)配置,SBR是頻帶復(fù)用技術(shù) ,而PS是參數(shù)立體聲,其中后面兩個標(biāo)注又稱為 AAC Plus和AAC Plus V2。 4、AAC在編碼模塊上還使用到一些技術(shù),比如SRS,LTP等等。 相關(guān)參數(shù):
比特率:超過400kbps (mp3: 32-320kbps) 采樣率:8khz-96khz (mp3: 16khz-48khz) 常用名詞:
2 pass: 在編碼中使用的一項技術(shù),就是先對要編碼的文件進(jìn)行一次pass,觀察碼流的特性,保存下來,第二次pass根據(jù)第一次的碼流特性進(jìn)行編碼,應(yīng)該來說也間接實現(xiàn)了VBR。 聲道和音軌:音軌是一種錄音技術(shù),就是將不同的音樂錄制在不同的音軌上,然后將多個音軌合成一個聲道,或者一個立體聲音軌。聲道是衡量聲卡的一個性能指標(biāo),聲卡解析出文件的各個聲道然后送到各個音箱??梢园崖暤览斫獬刹シ艜r候的音軌,因為聲道的原理 也是將各個聲道的數(shù)據(jù)送到音箱,從而呈現(xiàn)出一種聲音的立體感。 單軌和整軌:比如將一個CD壓制成一個APE文件,則就是整軌,而單軌就是將CD按曲目壓制成多個文件。 附:
1.1 MP3 Decode Mp3 Decode 必須提供對Mpeg-1 layer I/II/III 以及Mpeg-2 layer I/II/III 標(biāo)準(zhǔn)的完整支持,對Mpeg-1 layer II/III 的優(yōu)先級最高,然后是Mpeg-2 layer II/III ,最后是Mpeg1/2 layer I 。 對以上規(guī)格下的各種Sampling rates 和Bitrates 的文件都能提供完整的解碼支持,并且能夠提供對VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解碼支持。
1.2 AAC Decode
AAC Decode 必須提供對Mpeg-4 Part 3 標(biāo)準(zhǔn)下LC/HE/HEv2 這3 個profile 的完整支持,對AAC LC 的優(yōu)先級最高,然后是AAC HE/HEv2 。 對以上規(guī)格下的8khz-96khz 采樣率以及400kbps 以上的比特率都能提供完整的解碼支持,并且能夠提供對VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解碼支持。
1.3 AMR
現(xiàn)階段對AMR-nb/wb 的codec 沒有什么特別的要求,使用Google 自帶的codec 即可,將來如果有特別的需要將會以補充要求的方式提供。 1.4 WMA Decode
Wma Decode 必須提供對Microsoft WMA 和WMA professional 的完整支持,其中WMA1/2 的優(yōu)先級最高,其次是WMA pro 。 1.5 Real Audio Decode
Real Audio Decode 必須提供對Real Audio 1-10 的完整支持,支持RDT 協(xié)議以實現(xiàn)流媒體的在線播放。 1.6 AC-3 Decode
AC-3 Decode 必須提供對Dolby Digital EX 和Dolby Digital Surround EX 規(guī)格的完整支持。 本文來自CSDN博客,轉(zhuǎn)載請標(biāo)明出處:http://blog.csdn.net/yili_xie/archive/2009/11/12/4803596.aspx |
|
|