別認為對話式交互是進步!詳解對話式交互的6大缺點

最近兩年很多 AI 產品出現之后都采用了對話式(Chat)的形式。導致很多人認為對話形式(Chat)交互相對于常見的圖形化界面是一種進步。事實并非如此。

這種錯誤認知可能因為把 AI 技術與對話式交互畫上了等號,在看到 AI 技術迅猛發展的時候。就同樣認為對話式更優秀。

但這種交互形式被眾多 AI 產品使用的原因只是因為這一波 AI 浪潮最大的技術進步是大語言模型。而大語言模型的核心功能之一就是生成內容。加上 OpenAI 最早使用了這種形式被后來者效仿。

在 2017 年前后上一波 AI 浪潮中,主要的技術發展方向是計算機視覺,像人臉識別、自動駕駛、OCR 等等都是基于計算機視覺技術衍生的。

由于其技術突破方向并非語言方向所以就沒有產生對話式形式,由此我們可以看出:對話式交互只是一個附屬形式并非更優秀。

今天就詳細的講一下,對話式交互和圖形化界面相比有哪些缺點。

一、操作效率

GUI 的操作過程其實是眼、手、預置信息等三方面協同,眼睛瞄準、手點擊、預置信息觸發對應操作,但在 Chat 形式中幾乎全部依賴手了,所以操作效率下降。

其實很多圖形化界面的交互形式點擊幾次就能解決的問題使用對話形式可能需要多輪次、多描述才能完成,例如典型的訂外賣場景:

使用圖形化界面是這樣的:

別認為對話式交互是進步!詳解對話式交互的6大缺點

對 4 項不同的設置,只需要點擊 4 下就可以了,但如果使用 chat 的形式可能是這樣的:

系統:你要大杯還是小杯?

用戶:大杯

系統:零卡糖還是蔗糖?

用戶:0 卡糖

系統:正常糖量還是半糖?

用戶:正常糖

系統:熱的還是溫的還是冰的?

用戶:熱的

可以看出需要幾輪對話此案完成圖形化界面中 4 次點擊就能完成的操作,整體效率是很低的,這種形式也是非常真實的,不通過手機點單而是在門店直接下單店員真的需要把這些問題都問一遍。

但并非所有場景下 Chat 形式都比 GUI 形式低效,例如使用手機語音助手創建一個日程,可以退直接用語音指令:明天下午 3 點提醒我搶火車票,而不需要打開某待辦 APP-點創建待辦按鈕-輸入待辦各個字段的文字-點擊保存。

所以還是存在一個臨界值,需要從點擊次數、路徑長度、迷失度、可通訊通道場景等方面綜合衡量。

Chat 形式的每一次交互包含了操作+對象+修改內容的具體描述,例如在修改代碼時,需要給出指令:增大登錄按鈕的寬度到 500PX,需要把 GUI 交互中修改方式、修改對象、修改數值等全部使用自然語言描述一遍,因此會降低操作效率。

二、操作歧義

由于操作過程完全依賴自然語言的描述,因此當用戶輸入的文字不準確、有錯字、多含義時,可能產生錯誤的結果。對用戶輸入準確率的保證性較低。

出現錯誤后還需要多加一輪對話進行澄清,這又會進一步影響操作效率。

例如,如果用戶想要搜索“蘋果的營養價值”,但不小心打成了“萍果..”,AI 可能會將“萍果”理解為一個不常見或者不存在的詞匯,從而無法正確提供關于蘋果的營養信息?;蚴墙o出與用戶期望不符的結果。

這是因為“蘋果”是一個常見詞匯,而“萍果”可能不是,導致 AI 無法正確理解用戶的查詢意圖。

同樣的,作者真實的經歷是在某電商平臺搜索「蘋果」結果顯示了一堆手機,其實作者本身是想買點紅富士吃吃。對于有多重含義的詞匯使用對話式交互就很容易出現這樣的問題。

當然我們可以通過更完整的描述來避免誤解,但輸入更完整的描述本身就是更高的操作成本了。

三、自我描述能力

GUI 形式會把產品的能力直接體現在用戶界面中,如搜索框、時間選擇器、下載等能力,Chat 形式最大的問題是手續愛你需要用戶能想到,這一步就把產品設計時從要求產品變成了要求用戶,對產品清晰性的影響較大。

在下圖中用戶可以很清晰的知道某篇筆記能導出、且能以多種格式導出,但 Chat 的形式則需要用戶先想到。

別認為對話式交互是進步!詳解對話式交互的6大缺點

四、用戶習慣

工具需要細分,手指甲和腳指甲的剪刀都會細分,何況是各種大需求,微信里可以打車但滴滴 APP 的日活還有幾億。

想打破用戶的習慣需要并非不可以,但一定需要新方案的體驗強于舊方案體驗+遷移成本。

人類會用自己習慣的方式解決問題,路徑依賴會影響人類在擁有多工具時的選擇,而 GUI 在過去的 10 年已經為用戶形成了極強的操作習慣。

還有一些生活中下意識的習慣也會有影響,例如兩個對話時,往往不是只只針對唯一話題進行多輪次對話,可能是兩三個主題并行的,此時 AI 在理解時就會比較困難(因為出現了一句與上下文無關的話)。

如果是在使用了多個模型/提示詞/agent 的產品中,這個問題可能會更加明顯,因為在用戶在對話過程中切換話題時是否能馬上切換到其他模型/提示詞/agent 來回答無法確定。

五、能力精細度

即使模型能力范圍越來越大,但很難想象把所有應用集中到一起會是什么樣子,分類是人腦生理結構決定的人處理任務/信息的方式。工具的 ALL in one 是個偽命題。

現在大多數通用 Chat,既能寫代碼也能畫表格,但通用的結果一定是不夠精深,在細分能力是不夠強大。

還是以畫表格為例,通用 Chatbot 可以實現快速把數據填充到表格,但不一定能設置某行固定。更復雜的科學計算公式也無法實現。

以 WPS 為例,功能豐富到需要使用十幾個標簽+每個標簽下數十個子功能來呈現。

別認為對話式交互是進步!詳解對話式交互的6大缺點

難以想象使用通用 Chatbot 如何幫助用戶觸達這些功能,而這還只是一個 WPS 中的功能點,所以作者堅定的認為工具產品的 All in one 是個偽命題。追求通用則一定在精細化能力上會有不足,就像我們設計師常用的設計規范,在追求通用性的同時面對不同業務場景的個性化能力就會被削弱。

六、多語言適配

在面對產品國際化、多語言適配的問題中,圖形化用戶界面只需要把界面中出現的文字做翻譯即可,部分還可以使用圖標替代更具通用性。

但大模型的輸入、輸出都使用了大量的文字,那么面對多語言是否能很好的支持是個問題。

對于一些小語種,可能根本沒有足夠用于模型訓練的數據量,那么模型就更加不可能提供優質服務了。

以上是對話式交互的 6 大缺點。下面再簡單聊聊對話式交互的優點,這一部分比較好理解就簡單描述了:

① 易學性

對話式交互很直觀,用戶無需學習復雜的界面或命令,可以直接用自己的語言與系統交流。就像功能點非常多產品里面我們經常找不到需要的功能在哪里一樣,對話式交互沒有這個問題,因為不需要在復雜的界面中尋找。但依然需要用戶已有「這個產品用這個功能」的認知。

② 靈活性

用戶可以通過對話來表達繁瑣的命令,例如手機語音助手的一句話創建待辦,但要注意這里所說的「繁瑣的命令」還不是「復雜的命令」,只能解決多步驟但每一步都比較簡單的問題。

圖形用戶界面中,用戶只能點擊到當前顯示出來的元素(如按鈕),操作依賴屏幕可顯示范圍,但對話式交互沒有這個問題,因為已經用「描述」代替了屏幕中必須顯示出來的功能。

③ 設備適應性強

對話式交互可以很容易地集成到移動設備、智能揚聲器或其他物聯網設備中,只要設備有麥克風、揚聲器、處理器即可滿足基本的對話式交互(這里特指語音交互了),減少了屏幕在設備中的成本。

這方面的實例已經非常多了,就像小米的智能音箱,還有商場中的服務機器人。

④ 擴展性

可以添加新的功能和服務,而用戶無需下載更新或學習新的交互方式。正式因為沒有圖形界面的限制,在增加功能時也不需要考慮界面顯示能力,不需要像 GUI 時代一樣因為空間只能擺放有限個入口而爭來爭去了。

但這一點同樣會帶來曝光率的問題,因為能力的擴展對用戶來說是隱形的過程,即使使用新版本功能引導也只能被用戶看到一次(其實大概率一次都看不到就點擊關閉了)。

而不像 GUI 那樣有一個固定的位置顯示,經常能被用戶看到。

以上是對話式交互的優點,要注意以上內容并非語音交互哦,討論范圍大概還是限定在文字對話形式的范圍內。

歡迎關注作者微信公眾號:「AI與用戶體驗」

別認為對話式交互是進步!詳解對話式交互的6大缺點

收藏 16
點贊 42

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。