电竞比分网-中国电竞赛事及体育赛事平台

分享

多媒體測試庫建設(shè)之音頻部分

 xrzs 2010-02-24
多媒體測試庫建設(shè)之音頻部分 收藏
 多媒體 測試庫建設(shè) 之音頻 部分
最近要為公司寫多媒體式樣書,并建立一個多媒體測試庫,說實話以前一直做codec,卻從沒有寫過對整個一個產(chǎn)品的式樣書,也不知道是否符合標(biāo)準(zhǔn)規(guī)范,現(xiàn)在把一些操作過程記錄下來,如果有高人覺得不適合或者有誤的地方,還請多指點~~
先說明一下我壓制測試文件 選擇編碼器的標(biāo)準(zhǔn):如果有官方提供的標(biāo)準(zhǔn)編碼器,就使用標(biāo)準(zhǔn)的編碼器,如果沒有就使用現(xiàn)在在壓制音視頻上比較廣泛使用的codec。
1、AMR
對MID而言,AMR的要求并不是很高,因為AMR作為人聲編解碼相對來說復(fù)雜度較低,沒有太多復(fù)雜而龐大的計算,所以AMR暫時就不作測試要求了,使用google 本身提供的codec就可以了。
2、MP3
現(xiàn)在比較廣泛使用的還是mpeg-1 layer |/II/III,在實際使用過程中發(fā)現(xiàn)mpeg-2 layer |/II/III還比較廣泛地作為著mp4,3gp的音頻壓縮格式,因此必須提供對mpeg-2的支持。對mpeg-1 layer ||/|||我使用的是開源的編碼器lame,對mpeg-2 layer ||/|||也是使用的開源編碼器twolame。另外所有的音頻源都是使用Audacity從FLAC文件中取得的,在重新采用和還原raw數(shù)據(jù)上我還使用了sox。
基本上整個編碼過程沒有朋到什么問題,頭一次使用sox和Audacity,沒想到linux 還有這么強大的音頻處理工具~~值得推薦。
3、AAC
對 AAC現(xiàn)在覺得只需要考慮對MPEG-4 AAC的支持,MPEG-2 AAC暫時不在考慮范圍之內(nèi)。在MID上必須支持AAC的全部3個profile : LC /HE /HEv2 。這里的編碼器選擇一般有兩個:Nero AAC和Faac。Faac只支持LC,雖然介紹上說還支持main,LTP等編碼模式,但在實際使用過程中發(fā)現(xiàn)好像并不支持。因此這次壓制的文件都是使用的Nero AAC,另外發(fā)現(xiàn)Nero AAC對于一些非工程規(guī)范的采用率好像不支持,因此在提供源數(shù)據(jù) 的時候盡量是標(biāo)準(zhǔn)工程采樣的數(shù)據(jù)。
4、wma/real audio/ac-3/dts
對這些的支持,我都是根據(jù)wiki以及官方協(xié)議 的版本來寫的式樣書,現(xiàn)在還沒有制作相關(guān)的測試文件

 
        mp3 簡介:
1、我們熟悉的MP3的全稱是MPEG-1 Audio Layer III ,是一種有損音頻編碼格式,屬于MPEG-1 Audio部分。
2、實際上MPEG-1在Audio部分包含三個版本,分別是Audio Layer I/II/III ; Layer I已經(jīng)基本過時不用了,現(xiàn)在使用得比較多的是Layer II 和 Layer III, Layer II現(xiàn)在主要用在廣播上面,我們熟悉的VCD實際上也是采用的這種音頻編碼方式,而Layer III現(xiàn)在則廣泛應(yīng)用 在各方面。
3、另外MPEG-2對MPEG-1 Audio進(jìn)行了擴(kuò)展,這就是我們現(xiàn)在熟知的MPEG-2 Layer I/II/III, MPEG-2廣泛用在數(shù)字電視信號傳輸,衛(wèi)星廣播等各方面 ,我們熟知的DVD也是采用了MPEG-2的音視頻編碼方式。
4、還有一種MPEG-2.5,這只是一種私有格式,用得很少,提供了很高的壓縮率。
相關(guān)參數(shù):
MPEG-1 Layer I is defined in ISO/IEC 11172-3, which first version was published in 1993.
    * Sampling rates: 32, 44.1 and 48 kHz
    * Bitrates: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 and 448 kbit/s
An extension has been provided in MPEG-2 Layer I and is defined in ISO/IEC 13818-3, which first version was published in 1995.
    * Additional sampling rates: 16, 22.05 and 24 kHz
    * Additional bitrates: 48, 56, 80, 112, 144 and 176 kbit/s
MPEG-1 Layer II is defined in ISO/IEC 11172-3
    * Sampling rates: 32, 44.1 and 48 kHz
    * Bitrates: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 and 384 kbit/s
An extension has been provided in MPEG-2 Layer II and is defined in ISO/IEC 13818-3
    * Additional sampling rates: 16, 22.05 and 24 kHz
    * Additional bitrates: 8, 16, 24, 40 and 144 kbit/s
MPEG-1   layer III sample frequencies (kHz):  32  48  44.1
bitrates (kbps): 32 40 48 56 64 80 96 112 128 160 192 224 256 320
MPEG-2   layer III sample frequencies (kHz):  16  24  22.05
bitrates (kbps):  8 16 24 32 40 48 56 64 80 96 112 128 144 160
MPEG-2.5 layer III sample frequencies (kHz):   8  12  11.025
bitrates (kbps):  8 16 24 32 40 48 56 64
常見名詞:
VBR : Variable Bitrate  Bit率是可變的
CBR : Constant Bitrate  Bit率是固定的
ABR : Average  Bitrate  平均Bit率,這是MP3的3種編碼的比特率模式
mono :單聲道
Dual channel : 雙聲道,每個聲道是比特率的一半,雙聲道不一定是立體聲 。
Stereo : 立體聲,包括兩個和兩個以上的聲道,每個聲道的碼率根據(jù)它所承載的信息量而定
Joint Stereo : 立體聲編碼的一種實現(xiàn)方式
Surround Audio : 環(huán)繞立體聲,一般包含六個以上的聲道
Sample Rate : 聲音編碼時候的采樣率,一般用Hz或者KHz為單位,即每秒里面采樣的Sample數(shù)
Sample Size : 每個采樣的深度,即每個采樣的bit數(shù)
Data encoding : 編碼以后的bit流順序,經(jīng)常用到的是floating-point
BitRate :這個是上面的這些參數(shù)的一個綜合反應(yīng),即每秒的bit數(shù)
Moving Picture Experts Group (acronym:MPEG) was formed by the ISO to set standards for audio and video compression and transmission

          AAC簡介
         1、AAC全稱Advanced Audio Coding,是一種有損的音頻編碼格式,更高范圍的采樣率(8khz-96khz)以及多音軌(up to 48)以及高性能的編碼效率,被譽為mp3的繼任者。
2、AAC的基礎(chǔ) 成形于MPEG-2 AAC,MPEG-4在MPEG-2的基礎(chǔ)上加入一些新的特性(比如SBR),就形成了MPEG-4的音頻標(biāo)準(zhǔn),定義為 MPEG-4 part3,我們一般所說的AAC,都是指MPEG-4 AAC。
3、AAC有3個標(biāo)準(zhǔn),分別是LC[Low Complexity],He[high efficiency](add SBR),HeV2(add SBR and PS)。LC是基礎(chǔ)配置,SBR是頻帶復(fù)用技術(shù) ,而PS是參數(shù)立體聲,其中后面兩個標(biāo)注又稱為 AAC Plus和AAC Plus V2。
4、AAC在編碼模塊上還使用到一些技術(shù),比如SRS,LTP等等。
相關(guān)參數(shù):
比特率:超過400kbps    (mp3: 32-320kbps)
采樣率:8khz-96khz    (mp3: 16khz-48khz)
常用名詞:
2 pass: 在編碼中使用的一項技術(shù),就是先對要編碼的文件進(jìn)行一次pass,觀察碼流的特性,保存下來,第二次pass根據(jù)第一次的碼流特性進(jìn)行編碼,應(yīng)該來說也間接實現(xiàn)了VBR。
聲道和音軌:音軌是一種錄音技術(shù),就是將不同的音樂錄制在不同的音軌上,然后將多個音軌合成一個聲道,或者一個立體聲音軌。聲道是衡量聲卡的一個性能指標(biāo),聲卡解析出文件的各個聲道然后送到各個音箱??梢园崖暤览斫獬刹シ艜r候的音軌,因為聲道的原理 也是將各個聲道的數(shù)據(jù)送到音箱,從而呈現(xiàn)出一種聲音的立體感。
單軌和整軌:比如將一個CD壓制成一個APE文件,則就是整軌,而單軌就是將CD按曲目壓制成多個文件。
 
附:

1.1 MP3 Decode
Mp3 Decode 必須提供對Mpeg-1 layer I/II/III 以及Mpeg-2 layer I/II/III 標(biāo)準(zhǔn)的完整支持,對Mpeg-1 layer II/III 的優(yōu)先級最高,然后是Mpeg-2 layer II/III ,最后是Mpeg1/2 layer I 。
對以上規(guī)格下的各種Sampling rates 和Bitrates 的文件都能提供完整的解碼支持,并且能夠提供對VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解碼支持。
1.2 AAC Decode
AAC Decode 必須提供對Mpeg-4 Part 3 標(biāo)準(zhǔn)下LC/HE/HEv2 這3 個profile 的完整支持,對AAC LC 的優(yōu)先級最高,然后是AAC HE/HEv2 。
對以上規(guī)格下的8khz-96khz 采樣率以及400kbps 以上的比特率都能提供完整的解碼支持,并且能夠提供對VBR/CBR/ABR 以及Mono/Stereo/Joint Stereo/Surround 的解碼支持。
 
1.3 AMR
現(xiàn)階段對AMR-nb/wb 的codec 沒有什么特別的要求,使用Google 自帶的codec 即可,將來如果有特別的需要將會以補充要求的方式提供。
 
1.4 WMA Decode
Wma Decode 必須提供對Microsoft WMA 和WMA professional 的完整支持,其中WMA1/2 的優(yōu)先級最高,其次是WMA pro 。
1.5 Real Audio Decode
Real Audio Decode 必須提供對Real Audio 1-10 的完整支持,支持RDT 協(xié)議以實現(xiàn)流媒體的在線播放。
1.6 AC-3 Decode
        AC-3 Decode 必須提供對Dolby Digital EX 和Dolby Digital Surround EX 規(guī)格的完整支持。

本文來自CSDN博客,轉(zhuǎn)載請標(biāo)明出處:http://blog.csdn.net/yili_xie/archive/2009/11/12/4803596.aspx

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多