開頭必須來一句,我相信語音一定是未來,我非常確認
這篇 HMI 的語言探索以介紹語音交互內容為基礎,結合我的實際工作項目經驗,輸出總結關于語音設計的內容,最后結合案例,在對話設計中會進行深度的探索,并提出個人的想法和思路,因為有的時候深度去思考覺得我們項目還可以有很多優化的點。
進入我們今天的正題。
在說語音交互之前,先給大家講一下題外話,關于人機交互(Human Computer Interaction)簡稱 HCI,可能日后我想去攻讀這個碩士學位,簡單來說就是指人與計算機之間通過使用某種對話語言,以一定的交互方式,為完成確定任務的人與計算機之間的信息交換過程。
語音助手最初的載體是手機 APP,通過與用戶之間的對話方式,能夠幫助用戶來解決問題的,隨著我們現在人工智能的研發技術不斷發展,包括讓機器學習,語音識別、圖像識別、自然語言處理、智能搜索等一系列。語音交互運用的很普遍了,不僅僅只是智能手機,現在涉及到的領域是越來越多了,如智能家居、汽車、可穿戴設備、就連商場普遍也有機器人語音對話。
我這邊就不打算講語音的發展歷史了,不然又是水了一大堆內容,我可是一個講干貨的小作家呢,如果我的小粉絲們需要的話,就私信我,我會在微信公眾號更文。
語言是傳遞信息重要方式,對于我們用戶來說,語音交互也是學習成本相對較低、容易掌握的,語音交互設計簡稱為 → VUI。
新能源汽車不斷的發展,智能車載系統也是我們最看重的。隨著語音交互的的普及,語音識別開始走入人們生活,憑借其實用性和準確性得到了用戶的認可,因此在發展的過程中摒棄了傳統的、繁雜的手動操作,提高安全駕駛屬性和更高效的處理問題的能力,但是,在現階段的新能源汽車發展過程中還不能完全替換掉手動操作。
現在為什么用戶在駕駛車的過程中,還是不會常用到語音交互,首先提到的就是用戶習慣,根據數據調查,在使用語音交互的人群中,年輕人占了主力軍,其余年齡段的人由于常年駕駛都是通過硬按鍵來操控車內空調、電話、音樂、電臺、內置導航。其實就算是蘋果手機中的 siri 都很少用到, 在使用初期因為技術的不成熟,再加上冰冷的對話方式使得用戶不對這個買單,像我現在生活中,用到的 siri 頻率也會很少,最多就是定一個鬧鐘,app 實在找不到就會使用到,還有無聊的時候和他進行無聊的對話,嗯就這樣子。
國內做語音頭部公司有我們熟悉的科大訊飛,還有和多家車企合作的思必馳、云知聲,對內服務的百度,搜狗,騰訊,阿里這些大咖都有自己的語音技術。
再講一下語音的基礎原理內容,這一塊比較難懂一點,首先你要說出你需要解決的需求、要處理什么事情,通過車載系統設備收到指令的語音 → 自動語音識別 (ASR) → 將指令轉化為文本 → 自然語言處理 (NLP) → 了解用戶需要解決什么問題 → 通過Skill (普及一下知識:Skill 是一種程序的語言,有notepad++,UltraEdit等,好了不啰嗦了) → 將處理好的結果處理成回復文本 → 最后再通過TTS 播報形式 → 形成回復音頻 → 通過車載系統回復給用戶解決結果,聽起來是不是有點復雜了,我相信我是全網說的最細的了。
如何去定義一個產品的語音的好壞?我覺得吧,能夠讓用戶對于這個語音系統的滿意度達到一個高標準,首先能夠讓系統能夠聽懂你所說的內容,并且給出相對應的解決方案,語音系統運用的簡而易用即可,如何做到以上的要求,我會在下面對話設計中會著重講解深挖的。
車載場景下的語音交互核心基本原則有三點:
1. 首先是安全
駕駛過程中,司機的眼睛、耳朵和手占據了大部分多任務操作,如果一些功能還需要通過眼睛和手來操作的話,會降低安全駕駛的系數,所以車載語音交互更有助于輔佐司機安全駕駛,減少注意力的分散。
2. 其次是便利
語音交互設計之初,一定要考慮便利、快捷,盡量的減少每一個任務的對話次數、快速響應、將對話流程簡單化,從而打破 VUI 對于用戶的一個心理障礙(便利這塊內容我會在后面對話設計中著重講解)。
3. 最后是愉悅
為什么要談到愉悅,因為市場上最初的語音對話交談,都是冷冰冰的,幾乎沒有情感可談,像極了和機器人對話,并且有的時候無法處理任務就會說,超出能力范圍,這是一個很不好的用戶體驗。現在市場上可以看到,導航軟件也有語音包可以選擇,這也是增加了情感化設計,這是其中的一個點。還有一個小點就是自然的對話交流,很流暢的完成用戶提出的每一項任務,盡可能的規避對話中的錯誤,讓整體的對話過程達到一個愉悅的感覺。
用戶在語音交互的時候,絕大多數都是帶有明確指示任務指令的,也有可能是閑聊狀態。
1. 任務狀態下:
任務式對話中,用戶需要盡快的得到想要反饋和解決方案,并且快速的完成,此類任務的反饋要求還需要清晰、簡單明了。
2. 閑聊狀態下:
我們經常也會問 Siri 一些無聊的問題,比如:“siri 給我來一段 Rap” 通常這類的任務帶有的目的性不是很強,但是對于趣味性要求會高。
語音是最舒服的交互形式,但是他不能完全取代 GUI,相互協作才是更佳的方案,所以現在市場上的車載系統大多數都是以語音(VUI)和圖形用戶界面(GUI)相組合的,也有少部分車加入其他交互方式譬如手勢交互。
語音與圖形的交互是交叉處理,從而形成了多模,多模態在我第二篇文章也有講到,第一次看我文章的同學們可以回顧一下,用戶在對車載系統發送一個指令的同時,設備會有多種的反饋方式,首先你可以聽到系統虛擬形象給你做出回答,其次你看到圖形界面的變化,舉一個例子,你說:“我要聽周杰倫的七里香”系統就會處理講頁面跳轉到音樂界面,并且播放周杰倫的七里香,如果聲音小了,你可以說:“聲音大一點”
大家是不是發現一個問題呀?我在前面說系統首先會做出回答,然后界面才會發生變化,但是實際情況,系統語音形象沒有做出任何多余的回答,而是直接聽取到用戶的需求,直接反饋出結果,播放了周杰倫的 #七里香#,這就是我準備在下面會重點講到的“對話設計”
在說對話設計之前,我們先了解一下 VUI 設計師,想必大家頭一次聽說,還有語音(VUI)設計師嘛,國內不太注重培養 VUI 設計師,大家可以去招聘平臺搜索一下語音交互設計師,很少有公司專門針對這個職位去招聘的,就算有,也是招聘算法等研發崗的職位,VUI 設計師的工作任務一般都是公司的產品經理或者交互設計師代勞了,這會肯定就有產品經理或者交互設計師想出來吐槽了,哈哈哈
語音交互方式給用戶聽和說兩個動作,相信大家也有聽過 7±2 法則,因此在聽到的信息設計發面需要考量,因為用戶聽到一遍內容之后就消失了,除非這款車機語音系統,有再次復述上一段話的功能,不然在語音設計的時候,千萬不要讓用戶產生的認知負荷,更不要挑戰用戶的短時間的記憶力,最強大腦除外,我們大多數人可不是什么最強大腦是不是。再次強調一下,就算擁有復述這個功能,也要注意設計的語音內容,該功能點只是加分項而已,不能打破底線,將語音設計的原則拋之腦后。
再分析一下圖形設計(GUI)和語音設計(VUI)之間的優缺點,那我們先從優點開始說起。
(1)前面我們有提到 VUI 只需要聽 and 說,而 GUI 則需要觸控屏幕內容,在效率和安全方面沒有 VUI 好,觸控操作比語音操作要相對會慢,語音交互方式中駕駛者無需離開方向盤。
(2)在對于整套車機系統而言,GUI 學習的成本遠高于 VUI,因為 VUI 只要會交流即可,無須像 GUI 一樣學習觸控交互手勢、在哪里點擊等一系列問題。
(3)還有一點,圖形設計是一種已經預設好了操作路徑和交互方式,頁面之間存在這層級交互的基本關系,用戶需要根據指定的操作進行,而 VUI 則突破了 GUI 的限制,交互更快捷了,舉個例子:“導航去虹橋機場”,VUI 則一步到位,而 GUI 首先需要找到導航應用的入口,然后再點擊搜索輸入框,輸入#虹橋機場,確認完畢之后,再點擊導航,我的天吶我寫的都很煩了,說真的還不如語音一步到位呢。
說完優點后,我們在反思一下 VUI 還有哪些沒有 GUI 做的好的點.
(1)語音交互涉及到 3 塊內容,語音識別,識別用戶所說的內容,其次語言理解,這邊會關乎到方言理解的問題,畢竟我國語言博大精深,難以參透哈哈哈,最后是語音的合成,這三塊內容如果有一塊出了問題,最后反饋的結果可能并不是用戶想要的答案。而圖形設計有這統一的執行操作指令,不會出現什么 bug 問題,如果有,那肯定就是這款車機在測試的時候測試人員遺漏的問題,可以投訴。
(2)整套車載的 GUI 設計都會有一套嚴謹的操作邏輯,有明確的信息分布和頁面的層級關系,但是 VUI 的功能不可見(除非你看那個使用手冊,哈哈哈哈哈)所有的場景 VUI 都需要去探索,在引導性方面會弱很多,所以在買車的時候抓住銷售員使勁的問哈,畢竟你花了一大筆錢來買車了,在試駕的過程中也要多去詢問,就先點到這里了。
(3)GUI 是可以全場景交互,不限制于任何場景,而 VUI 則會受到的場景因素較大,有較多場景中不適用語音交互,最直接的就是設置中的內容。
(4)語音設計對于用戶的一個記憶力是一個考驗,如果一個很長的 TTS 反饋,用戶不知道哪里才是自己所需要的信息,因此在做 VUI 設計的時候盡量簡短高效的句子,而 GUI 信息都會呈現在頁面中,所以這個點要相對優勝于 VUI 了。
總結一下
以自然交互為主的,聲音,顯然是最自然的交互形式,但不能完全取代圖形 GUI,而是更好的協作,盡量減少界面的形式設計,加強情感化的交互形式體驗,將智能化更好的融入到車載系統中去,讓每一位用戶能夠更好,更便捷,更安全的駕駛著汽車,是我們全體設計師的初衷。嗯,感慨了一下。
想用一個成語總結一下:相輔相成,就是這個意思
1. 一定要想好從哪里開始,到哪里結束
我們首先假設一個場景,調節空調溫度的語音設計,那 VUI 設計師需要將這個場景的對話要貫穿該流程中去,那接下去要考慮這段對話可能出現的任何狀況,以及相對應的解決反饋內容,再第二點設計 VUI 語法中,我給大家演示一下空調全方案案例。
2. 設計 VUI 語法
語法就是用戶輸入給機器的指令,VUI 的設計師需要了解對話設計的意圖,盡量要考慮用戶可能表達的所有方式,將最常用的表達方式提取出來,作為指令的模版,當然越多越好,這樣給用戶體驗帶來的感受會更好,能夠解決用戶的問題概率也會提高,別到時候語音助手反饋:“已經超出我能力范疇 or 您換個說法試試”,我一聽到這些就炸毛了,后面就不可能再去使用它了,因此 VUI 設計師一定要多考慮一下指令。語法我會在我工作實際案例有特別詳細的講解(在實際案例篇幅 - 使用語音場景分析里面),這個特別重要,大家要細細的品。
3. 空調案列分享:
用戶一開始的輸入指令可能有 “打開制冷模式”、“打開加熱模式”這些都會有點官方定義的語法感覺會很正式。
下面再延展一下用戶輕松的說辭 “我有點熱了幫我開一下空調”、“今天太冷了,車溫度好低啊” 其實用戶的說法有很多,但是空調的模式就這么幾種,所以需要抓住關鍵詞 #熱、#冷、#高、#低 ...,什么意思呢?因為這些關鍵詞是起到決定性因素的內容,其他的修飾詞語可能會千變萬化,所以語音助手一旦檢索到該詞匯,就可以做出判斷,到底是制冷、還是制熱、還是通風等功能。先簡單就介紹這一個,后面還有很多案列,大家好好看奧。
4. 如何設計好回答用戶的問題
在語音基礎介紹中也有提到過 TTS,他是語音交互中最主要的回答方式,就是將 VUI 設計者撰寫好的對話設計腳本,通過 TTS 轉化為語音去播報。回答能夠給用戶帶來最直接的感受,回復是好是壞,會直接影響到這款語音產品的體驗,想要設計好我想談兩個大方向,設計腳本盡量簡潔明了,全局系統語言特點保持統一,后續有案列可以敘述講解的。
國內的語音設計和國外也會存在差異點的,首先是地方語言的差異,國內語言多達 80 種以上,汽車智能語音在方言這一塊相對堪憂,能夠支持的方言相對較少,這也成為了中文語音識別的一個難題。
在設計語音之初我們就得定義好,需要支持哪些方言,比如粵語、河南話、四川話等,現在的車載版本微信可以支持 20 多種方言,但是整體的車機系統可能難以做到這一點,這塊內容是需要攻克的一個壁壘,據我查看國外報道,關于方言解決方案,寶馬、三星和松下三家公司與語音識別公司 Nuance 合作開發新智能輔助技術,這項技術使得汽車語音系統在處理特定的方言時,可以更加容易。
還有一點就是中西方語言文化差異,那就舉一個例子,單從一個社會禮儀就可以展現出兩者之間的差距,國人路過遇見熟人總愛噓寒問暖 “吃飯了嗎?”、“到哪兒去”、“最近怎們樣呀?”等,在我們看來,這是一種有禮貌的打招呼用語,但你要跟西方人這樣打招呼 “Have you had your meal?”、“Where areyou going? ”,他們則會認為,你想請他吃飯,或者干涉其私事,會引起誤解,而西方人見面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn't it? ”
1. 語音喚醒設計
車載語音喚醒分為免喚醒和需要喚醒,免喚醒的定義就是無需說出喚醒關鍵詞或者其他任何操作,就直接可以進行與語音助手交談并處理任務。如需要喚醒的話,觸發動作可分為點擊、按壓、語音等,目前市場上主流的車機喚醒方式有三種:
實體按鈕,好處就是能夠給到用戶觸覺上的反饋,用戶感知性強
虛擬按鈕:此類的按鈕一般都會在中控屏幕上面,喚醒的方式是點擊
語音喚醒:在駕駛場景中雙手被占用,不能遠距離的操作中控屏幕,最佳的交互操作方式就是語音喚醒
在語音助手形象設計方面,會分為兩種,一種是卡通化語音助手形象,而另外一種是抽象化語音助手,下面用實際案例展示一下,卡通形象我們就拿未來汽車的 NOMI,抽象化 Google 的 Android Auto 語音形象
基于工業設計 2021 年 01 期的調查數據分析來看,卡通化的語音形象在親和力上有很大的優勢,能夠被用戶快速的接受,但是辨識度上可能存在同質化嚴重問題,所以在效果表現力上面有欠缺,也較難表達車企的品牌理念。抽象化的語音形象則通過造型的多變和動效豐富,從而在設計感和效果上相對突出,在傳達性上也不滿意,用戶不容易知道當前語音是處在一個什么狀態下,在親和力上遠也不如卡通化形象。
關于車內可以延展很多應用的場景,要知道用戶在駕駛過程中需要完成什么樣的任務,接下來我們就圍繞這幾個核心的功能點 → 多媒體(娛樂)、車輛控制、導航、電話,順帶將每個模塊語音基礎話術指令帶過一下外加TTS反饋,也是讓初學者熟悉一下命令,這塊內容很重要奧,都是我在實際項目工作中總結出來的,大家要上點心好好看,答應我好嘛
1. 多媒體(音樂、電臺)
播放音樂、電臺或者是播客這些都是一輛車最為常見語音交互的功能之一吧,開車的時候都會聽一些音頻類內容,對于這個功能播放、暫停和切換歌曲等功能外,電臺快速選擇,針對這些功能我們可以劃分一些子功能對應的典型話術。
音樂-話術
- 播放音樂
按歌手 → 我想聽霉霉的歌、播放周杰倫的歌
歌曲名稱搜索 → 播放天外來物、來一首七里香
歌手名稱+歌曲名稱組合精準定位(因為有很多翻唱的曲目) → 播放周杰倫的七里香
按照語種 → 我想聽粵語歌、放一些英文歌
按照曲風 → 來點爵士音樂、播放搖滾音樂
- 根據音源播放語
在線音樂 → 播放qq、網易云、酷我音樂等等(因為每一家車廠合作的音樂供應商不一樣)
藍牙音樂 → 播放藍牙音樂、跳轉到藍牙音樂、放藍牙歌曲、切換到藍牙音樂、我要聽藍牙音樂
U 盤音樂 → 播放U盤音樂、聽U盤音樂的歌、跳到U盤音樂
- 音樂播放控制命令
切換當前播放列表上一首歌 → 切到上一首、上一首歌
切換當前播放列表下一首歌 → 放下一首音樂、切下一首
換一首歌播放 → 換一首歌、換一個音樂、換個歌
暫停歌曲 → 暫停音樂、音樂暫停、停止播放音樂、不想聽歌了
繼續播放 → 繼續播放音樂、播放音樂
針對于音樂這個模塊的基礎語言先講到這邊了,因為在線音樂的功能相對比較多,所以后續我會對于 QQ 音樂、網易云、酷我音樂等在線音樂額外的語言控制命令再寫一篇續集。
電臺-話術
- 播放電臺
打開電臺 → 打開/開啟收音機、聽廣播、播放電臺/收音機/廣播/Radio
按頻率收聽 → 調頻<104.5>、播放調頻<104.5>、收聽調頻<104.5>、廣播<891>
按頻段+頻率搜索收聽 → 我想聽FM<104.5>、FM<104.5>、收聽/播放/我要聽FM<104.5>、收聽AM<1045>
按電臺頻道搜索收聽 → 我想聽音樂類電臺、我要聽上海<民生聊聊>電臺、收聽<交通>/<新聞>廣播
按在線音源+音頻類型搜索并播放 → 播放喜馬拉雅的相聲
按藝術家+音頻類別搜索并播放 → 我想聽郭德綱的相聲
- 播放源
喜馬拉雅 → 收聽/打開/我想聽 喜馬拉雅
FM → 打開/收聽/我想聽/播放/我要聽 FM
AM → 打開/收聽/我想聽/播放/我要聽 AM
- 電臺掃描
掃描電臺 → 掃描電臺、搜索電臺、重新搜臺、搜尋電臺、搜索頻道、掃描頻道
- 電臺輪播
輪播電臺 → 瀏覽電臺、電臺瀏覽、電臺輪播、輪播電臺、快速瀏覽
- 電臺播放控制命令
上一個電臺 → 上個頻道、上一個臺
下一個電臺 → 下一個臺、切到下一個臺
換臺 → 換一個臺
暫停電臺 → 暫停電臺播放
收藏/訂閱 節目 → 收藏、收藏這個、添加收藏、加入收藏
取消 收藏/訂閱 節目 → 取消收藏、收藏取消
車輛控制-話術
基本功能包括車內空調溫度調節、控制車窗開關、后視鏡角度的調節,還可以切換駕駛模式、變換檔位等等。
- 空調控制
空調控制 ON/OFF → 打開空調、關閉空調
空調 Auto → 打開自動空調、自動空調開啟
空調打開+模式 → 太冷了、好熱啊(檢索到關鍵詞,制冷/熱進行切換模式)
空調風量增減 → 風量大/小一點、風大/小一點
設置風量級別 → 風量設設為2級、風量調成2級、風量最大/小
空調溫度增減 → 溫度高/低一點、溫度調高/低一檔
設置溫度級別 → 溫度調到xx度、溫度設置xx度、溫度調到最高/最低溫度(空調溫度調整到對應指)
空調吹風模式 → 吹臉/腳、吹臉吹腳、吹腳前除霜、前除霜(前除霜:處理前擋風玻璃的)
后窗除霜 → 打開后除霜/霧、打開后窗加熱、后擋風玻璃除霜/霧
- 車窗
開啟/關閉車窗 → 開/開啟/打開/關/關閉 車窗(未指定某一個窗戶,打開/關閉所有車窗戶)
指定開啟/關閉車窗 → 開/開啟/打開/關/關閉 - 左前/右前/左后右后窗 、 打開/關閉主駕旁邊車窗、打開/關閉前排窗、打開/關閉后排窗、打開/關閉全部窗戶
車窗開啟/關閉到具體數值 → 車窗開/關一半(1/2)(車窗調節范圍0-100%,根據不同車廠設定值為準)
- 情景模式
前文中有提到 TTS 反饋,那我就在車輛控制中情景模式詳細舉例子給大家講解一哈。
清涼模式 → 打開/開啟/關閉 清涼模式 TTS反饋 清涼模式已打開/關閉、清涼模式已處于打開狀態
溫暖模式 → 打開/開啟/關閉 溫暖模式 TTS反饋 溫暖模式已打開/關閉
雨雪模式 → 打開/開啟/關閉 雨雪模式 TTS反饋 雨雪模式已打開/關閉、即將關閉車窗,請注意安全
抽煙模式 → 打開/開啟/關閉 抽煙模式、我想抽煙 TTS反饋 抽煙模式已打開/關閉
導航-話術
導航是我們最常用的功能之一,對于用戶而言輸入地址是一件頭疼的事情,所以在導航去目的地的時候,直接語音輸入后,匹配所需要導航的目的地,讓語音助手幫你直接導航,還可以詢問語言助手到達目的地時間和距離播報,有的車機導航系統還可以支持語音縮放地圖大小,省得兩只手指在觸控屏幕進行放大縮小操作手勢,在導航中的使用語音主要的目的就是便捷與高效。導航中的執行邏輯我這邊就不做過多敘述,因為相對要更專業點,后續有機會我再深挖講解。
- 導航
公司 → 我要去公司、導航到公司、去公司、上班了
回家 → 我要回家、導航回家、回家了
注:如果沒有設置公司/家的地址 需要進入設置公司/家的具體地址流程,設置完畢之后,方可語言導航去公司/家
附近加油站 → 導航到附近/周圍/周邊加油站、幫我找個最近的加油站
當前位置→導航到模糊的POI(會產生多個結果) → 導航到火車站(拿上海舉例子:上海有虹橋火車站、上海火車站、上海南站、松江站、上海西站,因此產生了多個結果后,語音助手還會繼續問到你需要導航到具體那個火車站,如果時間超過定義時間將默認為第一個)
當前位置→導航到POI簡稱 → 導航到人廣(人民廣場,要不要和我一起去吃炸雞?? 哈哈哈)、帶我去交大(交通大學)
- 增加途徑點
附近其他 → 導航附近三甲醫院
搜索指定位置+指定類型 POI → 幫我找一下南京西路的日式餐廳
搜索指定距離+指定類型 POI → 兩公里以內的停車場、一公里中式快餐店
搜索指定位置+指定品牌 POI → 南京西路的古馳店
- 導航距離/時間的播報
查詢途徑點的距離播報 → 距離南京西路還有多遠、距離下一個途徑點距離還有多少
查詢途徑點到達耗時播報 → 到南京西路還需要多久、距離下一個途徑點還要多長時間
電話-話術
在駕駛過程如果需要撥打電話,是一件不太容易的事情,而且是極其危險的,所以需要結合語音進行來輔助,接聽/掛斷不管是屏幕觸控還是方向盤的硬按鍵都可以直接操作,體驗還不錯,對于不習慣語音的的人來說該功能點可以替代,但總體來說,語音接通/掛斷會優于屏幕觸控,硬按鍵對于長期使用來說可能會有優過語音,對于用戶來說,在安全駕駛前提下,哪種使用方式習慣就用哪種。
- 撥打電話
聯系人姓名 → 打電話給老媽、呼叫老爸、聯系哥哥、給姐姐打電話
撥打電話號碼 → 打電話給12315、打電話給18015888888
撥打常用黃頁名 → 打電話給中國電信、給上海銀行打電話
- 接聽/掛斷/重撥/回撥
接聽 → 接聽/接電話/接通電話/接聽電話
掛斷 → 掛斷/掛電話/掛斷電話/掛掉電話
重撥 → 重撥電話
回撥 → 回撥電話
對話設計是基于人們的對話的設計語言,它集合多個設計的內容,其中包括語音用戶界面設計、交互設計、視覺設計、動畫設計、語音對話腳本設計、乃至還有音頻設計增加語音助手的靈動性。
對話設計的是否成功與否最重要的就是個性,現在市場上的許多車載語音系統對話聽起來還是基本很相似,是因為很多公司都沒有專業的對話設計師,要么是程序員、產品經理、好一點的公司組建一個語音組,都是從其他行業轉化過來,然后將各個大廠的語音對話研究一下,就上崗了,國內優秀的 VUI 設計真的很稀缺,也是很缺少的人才,我可不想再用語音交互的時候語音助手和我說“對不起,我沒懂你的意思”
對話設計師在規劃用戶在具體每個功能模塊區域內做什么,同時還要考慮用戶的需求和技術限制,對話的策略,是代表著該語音系統完整的用戶體驗,也包含這詳細的規范定義流程和底層邏輯。
這邊需要著重的講一個小知識點:
我們會有一個誤區,認為“對話”僅只是說 or 聽到的內容,其實對話本質上是多模態的,對話的核心內容是對話的流程和底層邏輯,圖形界面的邏輯一般都不太會用在對話內容的設計方面,基本上他們兩是一個獨立的個體。
1. 語音簡短化
車載語音的對話做的是否 OK?是基于對話內容時間的長短,因為用戶沒辦法像查看 UI 界面內容那樣,去查看語音的內容。根據人的平均記憶力,如果車載語音虛擬形象說了,關于這個話題很多內容,用戶可能無法記全所有的內容,這對于對話將大打折扣,因此在對話過程中需要嚴格遵循 → 簡短明了,讓每一個文字都有意義,避免重復的短語,可以讓用戶快速的做決定。
2. 響應等待設計
當用戶在用導航功能的時候,語音對話說“導航去火車站”,如果在上海的話,就有好幾個火車站,需要用戶再次去選擇,1 虹橋火車站、2 上海火車站、3 上海南站、4 上海西站,我們在做項目的時候,體驗設計師給他的定義是如果用戶超過 8 秒還沒有進行選擇的話,默認是選擇第一個,如果第一個目的地不是我想要的,那么我需要重新通過語音再次輸入信息。我覺得默認選擇這個選項可能會有些不妥,如果這期間來一個電話或者是微信的語音電話,那么我是不好通過語音去選擇的,如果汽車不是在駕駛的狀態,可以手動觸控屏幕進行選擇 OK 沒問題,如果是駕駛狀態下,就需要優化前面默認選擇項了。
我的想法
(1)超過 8 秒鐘后,默認選擇第一個沒有問題,但是在用戶結束自己之前任務狀態后,可以說重新選擇目的地,將之前的搜索出來的火車站結果都再次調出來,提供用戶重新去選擇。
(2)這塊就更智能化一些了(這個有一點前瞻性的意思,研發要是看到這個需求估計要揍死我),當語音助手檢測用戶正在忙的狀態時候,在 8 秒鐘都沒有做出選擇,那么語音助手可以從第一個目的地開始播報,用戶可以通過方向盤 OK 硬按鍵去選擇自己所需要導航的目的地,在駕駛過程中,方向盤的硬按鍵安全性遠高于中控屏幕的點擊。
3. 避免過多的選擇
給用戶提供選擇的選項列表的時,最好不要超過三個選項,給用戶較少的選擇,能夠讓用戶更明確去抉擇,減少過多選項對于用戶的干擾,剛剛上面導航那個案例排除,上海火車站真的太多了沒辦法,其他城市應該還好都是 1-3 個左右。
我的想法
上面實際案例就是強行逼迫用戶去選擇一個,這種體驗很差,有一種場景,如果這三個選項都不是我想要的,你就得重新說,幫我推薦一下附近的餐廳,想想這種體驗就不是我想要的,我覺得可以增加一些情感化的設計在里面,如果這三個選項都不是我想要的。
我可能會說“這些我都不想去、能不能幫我再推薦其他的”語音助手說“你可真挑食、好的,那我就再幫你找找其他美食”(我的意思就是要讓機器多去自我學習,更加智能化、情感化貼近于用戶的交流,這樣用戶才會更愿意使用語音交互)
上訴的場景是對于這塊區域不熟悉的用戶來搜尋美食,如果用戶有直接目的需要吃什么類型的餐飲的時候,語言助手只需要推薦相關美食就好。
用戶說“幫我找一下附近的海底撈”語音助手說“附近有三家海底撈,您是要去哪一家...(播報三家信息)”
(播報三家海底撈的位置和距離,甚至我想是不是可以增加排隊人數的播報,如果排隊人很多就可以換一家,接下來就可以和語音助手直接說幫我預約好位置,省的用戶到店面還要進行排隊等候)
4. 不要假設用戶知道該做什么
在做對話設計的時候千萬別考慮用戶的思考邏輯,每個人的思考邏輯都不一樣的,所以不用去猜想用戶的想法,只需要提供有用的信息讓用戶自己選擇好了,前面有提到對話設計是講究有邏輯性的,你在設計對話劇本的時候不可能就只考慮一條線。
舉個簡短的例子,你在設計一個訂購飛機票語音對話流程,你想法是,首先先確定目的地,哪里起飛去哪里,然后再選擇時間點起飛。假設用戶直接說:“幫我預定早上八點的飛機,飛往深圳。”那問題來了一開始是用戶是說的時間,最后只說了目的地,沒有有說出發地,因此在語音設計劇本的時候,你需要將所有能出現的狀況都考慮進去。
5. 語言文案設計一致性
在圖形設計之前 UE 也需要將動詞、名詞之間的搭配提前定義好,需要全局保持一致性,這塊內容有在我第二篇文章提到過,因此在對話設計過程中也要格外注意。
6. 不要信息轟炸用戶
現實中我們正常處理事物的時候,也是將事物劃分成幾塊,然后按照計劃步驟進行,而不是一股腦子亂做,車載語音設計也是如此,作為一個正常的用戶來說,我們一次性說出的需求并不會很多,不會像專業的車機測試人員一樣,去敘述一大堆信息去檢測機器的運轉效率,和一個處理信息的準確性,每次出差去南京走查,都會聽到測試人員巴拉巴拉 一直說,我腦袋都大了,所以我們正常用戶都是逐步的去說消息的,舉個列子
7. 避免使用專業術語
舉一個場景的例子,當你在道路上開車,需要停在路邊接朋友,朋友還沒有到達指定位置,或者該位置是不可以停留的,語音助手正確說法“這邊不可以停車,不然交警叔叔會罰款的,趕緊溜,我幫你找一個附近可以停車的地方吧” 錯誤的說法:“你觸犯了了我國《交通法》第 XXX 條,......此處省略法律條文這邊是禁止停車的”
首先當你聽到觸犯法律,你的第一想法 what?這是什么鬼,給用戶的感覺是很糟糕的,因為法律消息通常會包含長閱讀并且還不自然的語言,給用戶帶了不好的體驗,并且還未給解決的方案。一個好的語言設計方案會讓人喜歡上使用它。
后續我會對于前瞻性的語音進行探索,再寫一篇。前瞻性的就再舉一個吧:通過面部掃描,檢測到用戶不開心的時候,車載系統可以推薦一些治愈系的電臺,或者可以讓用戶放松、舒緩心理的的歌曲,或者你進行人機交談(這個就比較高級,需要讓語音系統進行大數據自我學習,達到能夠和人能正常交流),讓我們一起展望未來吧。
文章中如有不足之處,歡迎補充交流,我們下期見
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 5 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓