超碰爱爱-超碰v-超碰caoporen-超碰caopor-日本成人免费-日本成人毛片

歡迎來到通信人在線![用戶登錄] [免費注冊]

關于語音編碼質量的主觀評價方法

瀏覽:20066  來源:通信人在線  日期:2020-03-02

語音編碼質量是衡量語音編碼優劣的關鍵指標之一。評價語音編碼質量的方法很多,歸納起來可以分成兩類,即客觀評定法和主觀評定法。

欲了解幾種低速率語音編碼標準的客觀評定法和主觀評定指標的請進入

那么對語音編碼質量的評定采用主觀評定方法,是因為這符合人類聽話時對語音質量的感覺。語音主觀評價方法種類很多,常分為可懂度(Intelligibility)評價和音質(Quality)評價兩類。音質直接反映評聽人對輸出語音質量好壞的綜合意見,包括自然度和可辨識說話人能力等方面。而可懂度則反映了評聽人對輸出語音內容的識別程度。音質高一般意味著可懂度也高,但反過來卻不一定。

一、音質(Quality)評價方法

1、平均主觀值法(MOS

平均主觀值(MOSMean Opinion Score)法從絕對等級評價法(ACRAbsolute Category Rating)發展而來,用于對語音整體滿意度或語音通信系統質量的評價。ACR是用于針對電話通信的總體質量評價。MOSACR一樣采用5分制的五級的評分標準,對話音質量進行綜合評定。從發明電話開始,語音質量的測量方式是主觀的,人們摘起一個電話,然后由人耳來感知語音的好壞,這個主觀的語音質量測量方法逐步被完善稱之為平均主觀值MOS方法,定義在ITU-T P.800中。基于該主觀評測,人類接聽和感知語音質量的行為被調研和量化,接聽何種級別質量的語音,得到多少平均主觀值MOS,人類將起主要的反映作用。這個語音質量和平均主觀值的對應關系為網絡的配置、基準和監視提供了標準依據。其MOS評分標準所對應的分值、語音質量級別、失真級別及收聽注意力等級(LESListening Effort Scale)等詳見下表1-1MOS法的分值范圍對應的質量等級名稱及質量描述詳見下表1-2

1-1MOS法的評分標準

1-2MOS法的質量描述

極好的語音音質表示重建語音與原始語音是不可區分的,并且沒有感知噪聲。相反,極差音質表示有非常厭煩的噪聲且表示重建語音有人為噪聲。圖1-1給出了3類語音編碼方法(波形、參數、混合)的比特率與MOS分值的曲線比較。

1-13類語音編碼方法的比特率與MOS分值的曲線比較圖

ITU-T建議P.800標準規范了幾種傳輸質量的主觀和客觀評價方法,包括ACR(含MOS)、DCRCCR等,其中P.800.1給出了MOS的術語;P.800.2給出了MOS的解釋和報告。欲詳細了解ITU-T建議的傳輸質量主觀評價方法的請查閱附件1-1

附件1-1ITU-T建議P.80008/96

2、失真平均意見分(DMOS

失真平均意見分(DMOSDegradation Mean Opinion Score)是由失真等級評價法(DCR Degradation Category Rating)發展而來。在對高質量話音通信系統的評價中它比ACR具有更高的靈敏度。在ITU-T P.800建議書的附錄D中給出了DCR測試方法,DCR用干擾等級評分,在每次評測之前需有一參考系統,評聽人根據參考系統判斷被測系統話音失真的大小,判斷標準列在表1-1中。

3、判斷滿意度測量法(DAM

判斷滿意度測量(DAMDiagnostic Acceptability Measure)法是由美國Dynastat公司推出的一種評價語音通信系統和通信連接的主觀語音質量和滿意度的評測方法。它具有一些獨特的優點。首先,它將直接途徑與間接途徑結合在一起進行主觀質量評價。這里所謂的直接途徑是指要求評聽人針對語音樣本給出個人主觀感覺而不依賴于人為評價等級的劃分;間接途徑則是指評聽人根據已有的評測標準,脫離開評聽人的主觀喜好來評分。這樣,評聽人既可以表達個人主觀喜好,又能依據標準對每項指標進行評測。例如,在背景噪聲下兩名評聽人或許對語音樣本的整體滿意度意見不一致,但他們很有可能會對語音樣本中摻入噪聲的多少這一指標達成共識。其次,DAM方法要求評聽人分別對語音樣本本身、背景和其它因素進行評價。一個評聽人可將評價過程劃分為總共21個等級,其中10級是考慮語音信號的感覺質量,8級考慮背景情況,另外3級是可懂度、清晰度和總體滿意度。總之,DAM是對語音質量的綜合評價,是在多種條件下對語音質量可接受程度的一種度量,它和DRT一樣也采用百分比評分。

二、可懂度評價方法

1、判斷韻字測試法(DRT

判斷韻字測試(DRTDiagnostic Rhyme Test)法是美國國家標準學會(ANSI)制定的標準之一(ANSI S3.2),它是衡量通信系統話音可懂度或者話音清晰度的一種測試方法,它主要用于低速率語音編碼的質量測試,因為此時可懂度已成為主要問題。這種測試方法使用若干對(通常為96對)同韻母單字或單音節詞進行測試,例如中文的“為”和“費”,英文的“veal”和“feel”等。測試中讓評聽人每次聽一對韻字中的某一個音,然后讓他判斷所聽到的音是哪一個字,全體評聽人判斷正確的百分比就是DRT得分。通常DRT采用百分比的五級評定標準,其評定標準所對應的語音質量級別等詳見下表2

2DRT法的評定標準

在實際通信中,清晰度為50%時,整句的可懂度大約為80%。這是因為整句中具有較高的冗余度,即使個別字聽不清楚,人們也能理解整句話的意思。當清晰度為90%時,整句話的可懂度已接近100%。所以對于低速率語音編碼,一般要求其清晰度能達到90%以上。

2、改進的韻字測試法(MRT

改進的韻字測試(MRTModified Rhyme Test)也是評測通信系統語音可懂度的ANSI標準之一(ANSI S3.2)。測試材料由6組每組50個同韻母的字或詞組成,例如,漢語中“干、捍、爛、旦、半、亂”,英語中“pinsintinfindinwin”,主要用于區分起始輔音或末尾輔音。評聽人針對所聽內容選擇出6個詞中哪個與之相符。

3、判斷中間輔音測試法(DMCT)和判斷頭韻測試法(DAT

DRT還演變出來另外兩種測試方法,即判斷中間輔音測試(DMCTDiagnostic Medial Consonant Test)和判斷頭韻測試(DATDiagnostic Auiteration Test),分別用于聽辨中間輔音,如英語中的和“stopper”和“stoker”,和末尾輔音,如英語中的“pack”和“pat”。這二者一般不適用于漢語。

其他的還有拼寫字母測試(SpAT Spelling Alphabet Test)、語音平衡字表法(PB Phonetically Balance Word List)等。

三、其他方法

現在又有許多客觀的測量方法已經出現并被應用,諸如:PSQM/PSQM+感知通話質量測量法、PESQ感知評估語音質量測量法(ITU-T P.862)、PAMS感知分析測量法(英國電信)等。PSQMPAMS測量方法都需要發送一個語音參考信號通過電話網絡,在網絡的另一端采用數字信號處理的方式比較樣本信號和接收到的信號,進而估算出網絡的語音質量。語音質量煩人感知評價法 (PESQPerceptual Evaluation of Speech Quality)結合了PSQMPAMS的優勢,針對VoIP和混合的端到端應用作了改進,并針對MOSMOS-LQ計算方法做了修改。該方法使用了各種校正(Alignments)和感性方法,相當準確地匹配了主觀MOS分。此外,有必要指出,平均主觀值MOS是廣泛認同的語音質量標準,因此,無論采用何種方法所有測量方法都必須對應它們的結果對應到最終的平均主觀值MOS,以上各種方法均可以最終以MOS值表示。

雖然主觀評價方法符合人類聽話時對語音質量的感覺,但由于其測試結果的獲得依賴于測聽者個人的主觀感受,所以為了減少個人反應的隨意性和不可重復性,一般對測試所用的設備、數據、測試條件及測試人員都有嚴格的要求,并有繁瑣的測聽程序規定,非常消耗時間、人力和費用,而且即便如此,測試結果仍然存在著一定的不可重復性,完全相同測試條件下重復測試結果也會有一定的隨機波動。所以需要強調的是,無論哪種主觀評價方法一般要注意下表3-1所列的問題。

3-1:主觀評價方法一般應注意的問題

欲更多了解語音傳輸客觀評定法和主觀評定概念的請進入

聯合國兒童基金會助學
© 2004-2025 通信人在線 版權所有 備案號:粵ICP備06113876號 網站技術:做網站
主站蜘蛛池模板: 超级方程式| 山西少儿频道| 炊事班的故事演员表| 婚前协议电视剧演员表| 五年级上册口算| 免费看污视频在线观看| 十大名茶排名表| xxoo电影| 第一财经今日股市直播间在线直播| 布莱克·莱弗利身高体重| 薛昊婧演过的电视剧| 莫恭明| 礼佛三拜正确动作视频| 抖音网页版登录| 相武纱季| 乙亥北行日记| 美女网站黄视频| 白浩| 马修| 褚阳| 免费头像图片女生| 王兴德| 溜冰圆舞曲音乐教案| 一级片黄色录像免费看| 晓彤| 慕思成| 追诉电视剧| 蒙台梭利教师资格证官网| 极地特快电影英文版| 电商运营计划| 池田夏希| 黑洞表面豆瓣| 欢乐的牧童钢琴谱| alexis crystal| 欧美成熟| 二年级上册数学试卷题全套| 孙启皓| 谷桃子| 相见故明月| 网络流行歌曲2024最火前十名| 四三二一|