在語(yǔ)音編碼技術(shù)中,合成語(yǔ)音質(zhì)量可以說(shuō)是語(yǔ)音編碼性能的最根本指標(biāo)。評(píng)價(jià)合成語(yǔ)音質(zhì)量的方法很多,多年來(lái)人們提出的許多方法歸納起來(lái)可以分為主觀評(píng)價(jià)方法和客觀評(píng)價(jià)方法兩類(lèi)。常用的主觀評(píng)價(jià)方法有3種:平均意見(jiàn)得分(MOS)、判斷韻字測(cè)試(DRT)和判斷滿意度測(cè)量(DAM)??陀^評(píng)價(jià)常采用改進(jìn)的巴克譜失真測(cè)度(MBSD)評(píng)價(jià)方法。對(duì)于低速率(4.8Kb/s以下)語(yǔ)音編碼技術(shù)常采用激勵(lì)型線性預(yù)測(cè)編碼算法。下面給出幾種低速率(4.8Kb/s以下)語(yǔ)音編碼技術(shù)的合成語(yǔ)音質(zhì)量的主觀和客觀評(píng)價(jià)指標(biāo),它們是LPC-10(二元激勵(lì)線性預(yù)測(cè)語(yǔ)音編碼)、FS-1016(碼激勵(lì)線性預(yù)測(cè)語(yǔ)音編碼)、AMR(混合激勵(lì)線性預(yù)測(cè)語(yǔ)音編碼)、新FS-1015(混合激勵(lì)線性預(yù)測(cè)語(yǔ)音編碼)和INMAARSA-M(改進(jìn)型多帶激勵(lì)語(yǔ)音編碼)5種編碼標(biāo)準(zhǔn)。
1、主觀評(píng)價(jià)指標(biāo)
表1分別給出了上述5種編碼標(biāo)準(zhǔn)聲碼器在無(wú)噪聲時(shí)的主觀評(píng)價(jià)(MOS、DRT和DAM)測(cè)試結(jié)果。
表1:5種編碼標(biāo)準(zhǔn)聲碼器在無(wú)噪聲時(shí)的合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果
2、客觀評(píng)價(jià)指標(biāo)
改進(jìn)的巴克譜失真測(cè)度(MBSD)評(píng)價(jià)方法的條件是:測(cè)試語(yǔ)音文件的噪聲電平分別為無(wú)噪聲、電平為15dB、噪聲電平為20dB,輸入語(yǔ)音電平分別為-9dB、-19dB、-29dB,每個(gè)輸入電平4個(gè)文件(男女聲各占1/2),與噪聲電平組合為36個(gè)測(cè)試文件。平均MBSD的測(cè)試結(jié)果詳見(jiàn)下表2-1~表2-5。表中的噪聲電平是對(duì)噪聲幅度直接取對(duì)數(shù)得到的,輸入電平是對(duì)輸入語(yǔ)音信號(hào)幅度歸一化后再取對(duì)數(shù)得到的。
表2-1:LPC-10聲碼器合成語(yǔ)音質(zhì)量客觀測(cè)試的平均MBSD測(cè)試結(jié)果
表2-2:FS-1016標(biāo)準(zhǔn)語(yǔ)音編碼器合成語(yǔ)音質(zhì)量客觀測(cè)試的平均MBSD測(cè)試結(jié)果
表2-3:AMR標(biāo)準(zhǔn)4.75kb/s語(yǔ)音編碼器合成語(yǔ)音質(zhì)量客觀測(cè)試的平均MBSD測(cè)試結(jié)果
表2-4:新FS-1015標(biāo)準(zhǔn)語(yǔ)音編碼器合成語(yǔ)音質(zhì)量客觀測(cè)試的平均MBSD測(cè)試結(jié)果
表2-5:INMARSAT-M標(biāo)準(zhǔn)語(yǔ)音編碼器合成語(yǔ)音質(zhì)量客觀測(cè)試的平均MBSD測(cè)試結(jié)果
由表中的測(cè)試結(jié)果可知:噪聲電平越大,其MBSD的值也越大,即噪聲越強(qiáng),合成語(yǔ)音失真越大,這與實(shí)際是相吻合的。
欲更多了解語(yǔ)音編碼性能評(píng)價(jià)指標(biāo)概念的請(qǐng)進(jìn)入。