我邀請了小米探索實驗室的設計總監,和你聊聊智能音箱

南迪爾:?Hi 大家好,我叫南迪爾。我大學畢業后在工業設計領域比較出名的設計公司 LKK 工作,??然后12年加入百度,?主要負責百度云的交互設計,后面成為智能硬件團隊的設計經理,負責的項目包括小度Wifi、百度路由器、智能手表Rom 等一系列智能硬件。??2016年6月份加入小米探索實驗室擔任設計總監,負責小米路由器、小米VR 還有最近比較火的小米AI音箱小愛同學

我邀請了小米探索實驗室的設計總監,和你聊聊智能音箱

△ 圖源:maryanne

志榮:?你覺得??14年做的百度路由器和現在做的小米路由器有什么不同嗎??

南迪爾:?其實??很多地方還是比較相似的,例如大家都在追求更簡單的用戶配置流程,??用戶對于互聯網的??主要需求依然是一個穩定的網絡,這個需求沒有發生變化。?

志榮:在我的理解里,?用戶的全部網絡流量都要通過路由器,而且它是24小時開機的,我覺得是不是只要加個語音功能它就能成為中控系統?,后面就沒有智能音箱的事了?

南迪爾:路由器和智能音箱都是中樞系統。兩者的區別在于路由器是一個網絡中樞,?所有的東西都要通過路由器來連接到互聯網。?智能音箱是一個控制中樞,用戶通過它來控制其他設備。你剛剛說的可以認為是理想狀態或者實驗室狀態。但實際情況是,如果增加了語音功能,那么會有多少用戶愿意花錢買這個路由器?比如說,現在一個路由器的價格大概是100塊錢,如果增加一個語音功能,整個產品的價格要接近200元。如果這個路由器可以通過語音控制家庭里的 IoT 產品,問題來了,有多少家庭家里是有 IoT 設備的?如果增加了這個語音功能,這100塊已經把沒有 IoT 產品的所有用戶排除在外,而且購買這款產品的人群 IoT 需求到底有多少?用戶有可能前兩天用起來很爽,但是到后面可能只是用語音來開個燈。這些小需求能不能對得起用戶多花的100塊?

志榮:有道理。我想了解一下,這幾年你都在做智能硬件的項目,你覺得你在14年和18年做智能硬件設計時有什么變化嗎?

南迪爾:我在百度的時候,嚴格來說,當時的百度硬件積累相對較少,基本將硬件外包給其他廠商,所以當時的我對硬件的把控力度相對較弱,而且了解的比較少,所以基本都是在做軟件層面的設計。但到了小米之后,我發現小米的硬件和軟件是屬于同一個部門,而且小米在硬件上的積累很深。在小米的幾年里,我對智能硬件有更深入的理解,包括硬件的組成部分、硬件的定義、軟件和硬件的連接、還有它們之間是怎樣交互的,同時我能對整個用戶體驗流程能看得更加完整。我們做設計的時候甚至可以影響硬件的設計。以智能音箱的配置過程為例子。當智能音箱的軟件和硬件都擺在你面前的時候,你用手機配置音箱的過程中音箱會不斷給予你反饋,這會導致你的注意力在手機和音箱之間來回切換,我們覺得這不是一個好的設計。我們認為用戶的注意力應該集中在一個地方,所以我們有意地把用戶注意力先集中在手機上,音箱作為輔助,它只要發出確認的聲音就行了。當用戶用手機配置成功后,再把用戶的注意力轉移到音箱上進行互動和操作。如果不這么做的話,用戶注意力來回切換會導致整個配置流程很長,也會分散用戶的精力。

志榮:那你們當時是怎樣考慮智能音箱上的反饋設計的?

南迪爾:當時設計小愛同學的時候,燈光反饋更多是輔助功能。燈光亮的時候其實在給你一個信號,意思是「你可以說話了」。燈光是特定的語言,它在模擬兩個人對話過程中對方的眼神:對方的注意力是不是在你身上,是的話你就可以說話了。當然這時候的反饋不只是燈光,還有聲音的反饋。聲音反饋是非常必要的,原因是當你背對著它的時候或者不看它的時候通過聲音反饋就知道可以操作了。我們第一版的聲音反饋設計用的是「嘟」,就像小愛同學沖到你的身邊;第二版我們將「嘟」改成「在,我在」,這能讓人感覺到更溫暖。還有我們的燈光定義了好幾種模式。例如說「小愛同學」,這時候小愛同學發出的是燈光表示她在響應你以及在聆聽;當你說完指令,燈光發生的變化代表她在思考;當她給予反饋時燈光會有另外一個變化。這套燈光設計其實仿照了一個人的「我在聽你說」、「我在思考」、「我在說」這三種狀態。

志榮:你怎么看待最近 Echo show 增加了屏幕?語音交互是否需要屏幕?

南迪爾:這是肯定的,語音交互和屏幕結合是一件好事。我之前在知乎回答過一個問題,語音只適合有明確意圖的輸入,也就是說可以方便地問問題,但語音不適合輸出,語音輸出的內容太有限了,因為它是一維的,用戶根本記不住。我當時在知乎上舉過一個很讓人崩潰的例子「中文請按1,English press 2,金葵花客戶請按3」,當聽過一遍后,我要按哪個來著,忘了,我還得重聽一遍。音頻選項你是記不住的,頂多就4個選項;但是視覺界面不一樣,12個選項都沒有問題。

志榮:的確,我當時買了小度在家和小愛同學,但我發現有屏幕的小度在家能做的事情會多很多。

南迪爾:你最近會用小度在家和小愛同學來做什么?

志榮:沒有了,好久沒用過。

南迪爾:現在小愛同學更多是用來放歌,問天氣,問生活中的一些百科知識,還有 IoT 設備的控制,我覺得這是大部分人的場景和需求。

志榮:對,如果我家都沒有 IoT 產品,我都不知道我買一個智能音箱來干嘛。

南迪爾:用來放歌。

志榮:如果我連這個需求都沒有,那怎么辦。

南迪爾:如果你連聽歌的需求都沒有的話,那你為什么要買一個音箱回家呢?這說明你是一個嘗鮮用戶。買智能音箱的基本用來聽歌。

志榮:如果智能音箱解決的主要需求是播放音樂,沒有其他需求會不會導致沒有人去研發其他功能,那語音交互怎么發展?我覺得語音交互的發展會受到很大的局限。

南迪爾:語音交互很早就在手機上有了,但沒有爆發起來,是因為在公共場合的噪音比較大,人們在公眾場合使用語音交互效率不一定高;還有一些人覺得對著一個手機說話會有點傻;還有是隱私的問題,所以語音交互的場景是有限的。之所以智能音箱能爆發起來,是因為它在家里,家里比較安靜以及它是私密的空間。如果「隱私」和「不適感」這兩件事情是人們心理接受程度問題的話,隨著時間發展,人們會慢慢被接受。因為語音和搜索相關性比較高,輸入效率非常高。當一個高效的事情能克服不舒適感或者隱私問題,它會有市場的。

我邀請了小米探索實驗室的設計總監,和你聊聊智能音箱

△ 圖源:maryanne

志榮:那你覺得移動互聯網的設計和語音交互設計有什么區別?

南迪爾:移動互聯網設計和語音交互在一些基本的、隱性的設計上是沒有區別的,比如說你都要考慮場景和用戶的情緒。但語音交互的設計有點不一樣,就是它沒有視覺部分,這會導致它是一個開放性的提問。視覺界面的好處是你能看到邊界,你能進行引導;但語音是沒有邊界和引導的,所以你要學會創造引導。比如說設置一個鬧鐘,視覺界面很簡單,幾個時間控件就能把你完全限制在這個功能里。但用語音設置鬧鐘,我可能說「小愛同學我要設置一個鬧鐘」,然后它會問你「那你要設置幾點呢?」,「八點」,「請問是早上八點還是晚上八點」,「晚上八點」,「好的,設置完畢」,語音交互會通過多輪對話把你的發散范圍逐步縮小到這個任務上。

志榮:的確,我之前也想過這個問題,視覺界面能限制用戶的想法,語音交互就不能,我們只能在語音上創造限制。要不我們再聊一下 VR 吧。2016年被稱為 VR 的元年,突然間17年又變成人工智能的元年,你怎么看待2018年 VR 的發展,它是不是不溫不火?

南迪爾:我覺得 VR 的發展是正常的。新起的行業第一波總會吹成泡沫,因為投資市場不是冷靜的。第一波泡沫過去后留下的人會繼續推動這個行業的發展。現在行業的發展還是在硬件的成熟和積累階段,包括現在的 Oculus Go、Vive,雖然它們現在很不錯了,但它們不是最終形態。當它們逐漸接近最終形態的時候,會有越來越多的軟件加入,有越來越多的人認識到它們的價值然后依賴于它們,最后他們才能形成最終的形態。

志榮:那你覺得 VR 跟移動互聯網的產品有什么本質的區別嗎?

南迪爾:移動互聯網的產品我們可以分兩類,一類是 Save Time,它是省時間的,例如外賣、百度;另外一類是 Kill Time,它是殺時間的,例如抖音、愛奇藝、今日頭條。VR 目前來看更多是殺時間的,基本不包括省時間這個類別。VR 本身的硬件形態就決定了它沒有手機更省時間,因為你要戴上笨重的頭盔,在里面看不到你的手指和沒有合適的鍵盤,你的輸入效率并不高;而且現在的頭盔攜帶性不好,不能隨身到處帶著。如果 VR 想像移動互聯網這樣爆發的話,它的硬件形態一定要比掏手機更省事;而且價格很低。

志榮:我15年的時候寫過一篇文章來分析 VR 和 AR 哪一個會先火起來進入大眾的視野,最后我選擇了 AR。我覺得 VR 體驗不只是依賴視覺和聽覺,你的觸覺、嗅覺都是息息相關的。但是 AR 不會有這么多的限制,它不會有這么多的技術瓶頸在這里,只要你搞定了圖像識別基本就夠了,你覺得呢?

南迪爾:我覺得手機普及速度很快的原因是它 Save Time 的功能很多,它能幫你聯系到人、訂外賣、查資料、買東西。同理,AR 能做很多 Save Time 的事情,所以我相信它的普及速度會比較快。VR 更多走的是 PlayStation 和 Xbox 的道路,就是娛樂和消費。如果 VR 想要走進大眾的視野,在效率層面一定要超過手機,現在某些領域 VR 的效率優勢非常明顯,比如說看房,有了 VR 你就不用到現場看房了,還有像室內設計這些 ToB 的領域 VR 都有可能超越手機/PC 的體驗和效率。

志榮:那你覺得做 VR 設計和做移動互聯網設計有什么不一樣的地方嗎?

南迪爾:你設計的對象變了、設計的場景變了、設計的工具變了、設計的平臺變了,但設計本質沒什么變化。在形式設計上,你考慮更多的是 VR 平面和空間變得無限大,有前后和層次關系。

志榮:我覺得還有一個因素:時間的變化??臻g和時間是結合在一起的,平面就不一樣,你可以盯著它去看很久,但你看 VR 電影的時候,你看左側時右側就看不到了,信息不能被用戶接收,我覺得這個也是 VR 和平面設計的很大區別。

南迪爾:對,你說的有道理。還有就是,有些信息有自己的展現形態,它們的傳遞是不需要三維空間的,例如圖片、文字,它們不一定要轉換成3D。當你要看一本小說,你把文字加厚變成立體的文字,其實沒有任何意義,因為文字的二維形態就是最優解了。VR 增強的是你的體驗,在信息傳遞的角度來看它沒有太大的變化。但是有些東西本來就是三維產品,它們是帶有三維信息的,例如你從一張照片里看到的房間和走進這個空間里看到的房間,感受是完全不一樣的,三維信息在 VR 里展現才能突出 VR 的優勢。如果你用一個高維度的工具來看低維度的內容,低維度的內容還是低維度的內容。所以你問 VR 的界面設計有什么不同,當你的二維內容從平面移植到三維空間時,其實沒有什么不同,只是展示面積變得更大了,設計時我能用更多的層次關系,但本質上文字還是文字,光標還是光標。

我邀請了小米探索實驗室的設計總監,和你聊聊智能音箱

△ 圖源:maryanne

志榮:最后一個問題,年輕的設計師怎么拓展自己的視野?還有怎么提高自己的思考深度?

南迪爾:我覺得拓展視野分兩個維度。第一個維度是知識的積累,你可以上知乎或者國內外的網站學習相關的知識以及閱讀相關的報道,但我覺得視野更重要的一部分是你要親眼看到一些人做過的事情,你才會有感覺。例如你可以多參加一些展會和演講,親眼學習這些設計師是用了什么思路,最后做出什么樣的產品。思考深度這個要多問自己幾個為什么,時間長了就會形成習慣,你就會往最本質的原因去想。如果你想形成這樣的思維習慣,一開始需要一定的刻意練習??桃饩毩暰褪怯龅揭粋€問題,思考它背后的原因,然后把原因記下來,再去想這個原因背后的原因,如此重復下去,想到不能再想了。通過刻意練習的訓練,你的思考方式會逐漸變化并形成慣性。還有就是別光想,一定要用文字寫下來,大腦是一個很強的 CPU,但是它的內存不足,所以你要把文字和思考寫到紙上,然后只讓大腦去做思考的事情。

志榮:今天的收獲蠻多的,非常感謝南迪爾的分享!

歡迎關注作者的微信公眾號:「薛志榮」

我邀請了小米探索實驗室的設計總監,和你聊聊智能音箱

「設計師專訪」

收藏 16
點贊 30

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。