語音用戶界面(VUI,Voice User Interface)是人與語音對話系統(tǒng)交互時(shí)所接觸到的。它的元素包括提示音,語法和對話邏輯(即對話流程)。提示音是在所有對話中播放給用戶的錄音或合成的語音。語法定義了用戶對不同的提示音的可能的回答。對話邏輯定義了系統(tǒng)的行為。例如回應(yīng)用戶所說的話或從數(shù)據(jù)庫中獲取信息。
下面的例子是一個(gè)用戶和一個(gè)航班信息系統(tǒng)的一次交互過程:
系統(tǒng):你好,多謝致電“藍(lán)天”航空。我們最新的自動系統(tǒng)可以幫你查詢你需要的航班信息。請問你知道航班號嗎?
用戶:對不起,我不知道。
系統(tǒng):沒關(guān)系,請告訴我航班的出發(fā)城市。
用戶:北京。
VUI的設(shè)計(jì)原理和方法與其它用戶界面的設(shè)計(jì)原理及方法有相似之處。然而有一些語音界面的特征使它成為獨(dú)特的設(shè)計(jì)挑戰(zhàn)和機(jī)會。兩個(gè)最主要的特征包括:
1、感覺器官是聽覺器官:聽覺器官界面的獨(dú)特性在于它通過瞬態(tài)的或不能長久存在的信息(語音)來交流。用戶聽到了,然后就消失了。用戶沒有可能回顧系統(tǒng)的輸出或以他們希望的速度說出,相對而言系統(tǒng)對節(jié)奏有更多的控制。聽覺界面的這種瞬態(tài)特征對用戶的知識有一定的要求。而VUI設(shè)計(jì)的原則之一就是不要讓用戶認(rèn)知超載,不要挑戰(zhàn)人類短時(shí)記憶的能力,從而提供用戶影響對話節(jié)奏的途徑。
另一方面,聽覺器官提供的界面也為VUI設(shè)計(jì)創(chuàng)造了獨(dú)特的機(jī)會。人類從不同的層次與聽覺系統(tǒng)交互。他們不僅從所聽到的字詞和句子結(jié)構(gòu),也從這些信息傳達(dá)的方式來獲取它的意義:如重音和語調(diào)模式,聲音品質(zhì)及其它特征。通過仔細(xì)選擇錄音演員并有效指導(dǎo)他/她提示音的講法,你可以創(chuàng)建協(xié)調(diào),統(tǒng)一的系統(tǒng)形象特征。這就為設(shè)計(jì)者提供了為其設(shè)計(jì)建立品牌的機(jī)會。設(shè)計(jì)者也可以利用聽覺界面的特征,用非語音的聲音解決用戶界面的一些問題及為系統(tǒng)增值。一成不變或重復(fù)提示音常常會引起用戶的反感。即使是同一種提示音或回答同一問題,也應(yīng)當(dāng)用不同的說法,不要只用一種固定的語音,以避免聽者的反感。這一點(diǎn)相當(dāng)重要。
2、交互媒介是口語語言:我們每日花很長時(shí)間通過交談來溝通,理解人類的交談有利于改善人與機(jī)器的對話。人類有許多對話的慣例,假設(shè)和期望,有些是共有的,有些則專于某種語言社會。違背這些語言已有的東西所設(shè)計(jì)的用戶界面會使用戶感覺不適應(yīng),不易理解而更多的導(dǎo)致錯誤。有效使用這些人類共享的語言特征可以使人機(jī)對話更豐富,流暢。
VUI作為系統(tǒng)與用戶的直接交互界面,對語音系統(tǒng)用戶的經(jīng)歷影響很大。而好的用戶經(jīng)歷會帶來用戶對系統(tǒng)的認(rèn)可及多次使用;高自動化率;最好的客戶滿意度和投資回收率。用戶會感到“系統(tǒng)能識別我說的所有話”,“它隨時(shí)給我提供幫助,我從不會感到迷失”,“很簡單,我還會再使用它”。反之,用戶會感到迷失,開始責(zé)怪系統(tǒng)或不再使用該系統(tǒng)。
VUI是怎樣影響用戶經(jīng)歷的呢?
首先,在語音技術(shù)方面,好的VUI設(shè)計(jì)使得系統(tǒng)能在第一次交互時(shí)就得到正確的結(jié)果,減少用戶確認(rèn)次數(shù)及從錯誤返回的次數(shù)。
其次,在對話方面,好的VUI設(shè)計(jì)是技術(shù)和藝術(shù)的結(jié)合,使得用戶使用起來很簡便而且多樣化不乏味。它提供有效的主菜單提示音,可選的自然語言對話捷徑,與對話上下文相關(guān)的幫助及錯誤恢復(fù)和對新用戶的使用指南等。
最后,在系統(tǒng)形象(Persona)方面,好的VUI設(shè)計(jì)體現(xiàn)有趣而有吸引力的形象特征。它能拓展品牌;創(chuàng)造理想的“呼叫中心職員”;讓用戶感到系統(tǒng)高效,有幫助,令人愉快且有娛樂性。
語音識別系統(tǒng)不僅僅是一種技術(shù)產(chǎn)品。它要滿足用戶及商業(yè)目標(biāo)的雙重需求。而用戶界面,包括對話(Dialog)及形象(Persona)的設(shè)計(jì)則是建立一個(gè)充滿魅力的語音系統(tǒng),使用戶樂于重復(fù)使用的關(guān)鍵。
語音用戶界面設(shè)計(jì)的原則:說起語音用戶界面設(shè)計(jì),許多人可能就會想到許多瑣碎而細(xì)節(jié)的方法。例如,如何寫提示音,如何平衡提示音和語法等。毫無疑問,這些都是語音用戶界面設(shè)計(jì)的有效的技巧。本文限于篇幅,無法對這些技巧一一介紹。這里,我們就其對設(shè)計(jì)原則,即如何應(yīng)用這些技巧的原則作一些介紹:
1)在設(shè)計(jì)中應(yīng)從用戶那里取得意見來驗(yàn)證和優(yōu)化設(shè)計(jì)。從某種意義上來說,VUI設(shè)計(jì)者是最糟的適用性(Usability)測試者。設(shè)計(jì)者明確知道每一個(gè)提示音后面的意義,他們知道如何使用自己設(shè)計(jì)的界面,而對其它人則可能有困難。語音界面以語言作為媒介。語言的前后聯(lián)系,個(gè)人的經(jīng)歷,知識及語言技能都會影響對話。VUI設(shè)計(jì)者可能很難注意到用戶對他們的設(shè)計(jì)的困惑和不解。而用戶的反饋就成為解決問題的關(guān)鍵。
2)要同時(shí)考慮商業(yè)的需求和用戶的需求。并且要通過早期的工作來提高設(shè)計(jì)的效率。這是多年來軟件工業(yè)的經(jīng)驗(yàn)。作為設(shè)計(jì)者,在埋頭于諸多的設(shè)計(jì)細(xì)節(jié)之前,從商業(yè)目的考慮用戶需求,對應(yīng)用系統(tǒng)進(jìn)行深入的理解是必要的。通過這些理解確定VUI界面高層的,貫穿整個(gè)系統(tǒng)的設(shè)計(jì),例如系統(tǒng)形象(Persona)等。
3)進(jìn)行對話式的設(shè)計(jì)并考慮上下文的語言環(huán)境。設(shè)計(jì)者經(jīng)常專著于每個(gè)對話狀態(tài)的機(jī)械的細(xì)節(jié)而沒有注意到更大的上下文對話環(huán)境。人類的對話語言的上下文關(guān)系很重要,每個(gè)人都有這方面的技巧和經(jīng)驗(yàn)。有時(shí)也許是不自覺的。而作為設(shè)計(jì)者,在VUI中考慮和運(yùn)用人類固有的這些習(xí)慣是必要的,這樣可以設(shè)計(jì)出更有益于理解,更流暢和自然的對話。
總的來說,VUI設(shè)計(jì)是一個(gè)以用戶為中心的設(shè)計(jì)過程。目的是為了給用戶最優(yōu)的經(jīng)歷。創(chuàng)建有吸引力的交互過程,用用戶習(xí)慣的,靈活多樣而有引導(dǎo)性的方式,使用戶樂于使用,贏得用戶的忠誠,提高自動化率,從而獲得高投資回收,幫助公司擴(kuò)展形象和品牌。