3月21日晚,老黃穿著他標志性的皮夾克,在 GTC 2023 上說,ChatGPT 是 AI 行業的「iPhone 時刻」。時隔2個多月,Vision Pro 在 WWDC 上的發布,則呈現了未來數字產品形態的全新可能,而這同樣是一個「iPhone 時刻」。
早在 2016 年的時候,微軟就已經推出了 HoloLens,準備 All in 元宇宙的 Meta 也有自家的頭顯產品 Quest,甚至分高低兩個產品線。而游戲領域御三家之一的 Sony ,雖然手握大把游戲IP,但是游戲內容并沒有撐起自家的 PS VR2 ,而這個產品在中國大陸的預訂銷售,則由于 Sony 在不同平臺定價內訌之下,整個 PS VR2 定價干干脆脆地來了幾連跪。不要問我為什么知道。我反正退貨了。
HTC 的 Vive 就不說了。
XR 頭顯出來了這么多年,整個市場一直都沒做起來。之前一直被視作為頭部的 Meta 也沒做出啥成績。Meta 在 Quest 上上線的游戲《地平線世界》還因為人物角色沒有腳,而遭遇群嘲。可是就是這樣一個頂級科技公司,做了這么些年的 VR 頭顯產品,這樣的畫面素質真的是沒眼看,你就說這是 Android 1.6 時代的游戲,都有人信。
我相信前幾天 Meta 的 Quest 整個部門是一邊上班一邊看 WWDC 大會的, Vision Pro 發布的時候,只有悲喜交集四個字才能描述自己的心情。
悲自不必解釋。
喜的是終于有作業抄了。
而作為回應,蘋果也沒有在 WWDC 中提及哪怕一句 Meta 和元宇宙。一次都沒有。
從最直觀的外觀設計上,Vision Pro 就很蘋果。
酷似滑雪鏡外觀的 Vision Pro 所使用的硬件設計語言,顯而易見地延續了蘋果最近幾年來的工業設計語言,內嵌一整塊曲面玻璃的鋁合金外框有著細膩的陽極氧化處理,平滑的 G3 曲率表面和幾乎所有的蘋果系產品都保持一致,并且顯而易見,帶有喬納森艾維主導 ID 時代的印記。
內側的 Micro OLED 屏幕單塊超過 2300 萬像素,分配到雙眼上的效果超越4K顯示屏的效果,而和面部接觸的模塊所采用的細膩的織物表面極富親和力,這個可以根據臉型和眼部進行定制模塊,則結合固定后腦勺的彈性綁帶,為整體的佩戴舒適性做出了貢獻。
這種材質的選取和構建,顯而易見源自于蘋果在 Apple Watch、HomePod、AirPods Max 上的一系列探索的沉淀。
我們曾在 AirPods 系列產品上體會過的空間音頻,同樣是 Vision Pro 的聲學基礎,為了讓耳朵在真實虛擬空間之間靈活切換,賦予沉浸感的 Spatial Audio 技術則可以掃描環境,賦予虛擬物品和環境相匹配的聲場特征。
(別忘了 TWS 這個賽道可是 AirPods 系列一手開拓出來的。)
前面板的屏幕可以顯示用戶的雙眼,很大程度上降低了 Vision Pro 對佩戴者之外的其他人產生的恐怖谷效應。
Vision Pro 頂部的表冠則和 Apple Watch 神似,交互上想必也有著明確的「繼承關系」,這種相似性無疑是降低用戶認知負荷的絕佳策略。
內置的傳感器和堪稱性能怪獸的 M2 芯片是 Vision Pro 極致體驗的算力基礎,而專門定制的 R1 芯片則是 Vision Pro 的視覺呈現和反饋速度的保證。
但是 Vision Pro 又是顯而易見不完美的,是一個妥協的產物。
雖然目前官網上還沒有 Vision Pro 的具體重量參數,但是前往 WWDC 現場的 Up 主的反饋中,有人覺得佩戴起來偏重,有的則感覺還能接受,貼合度則因為可以定制+調節,倒是沒有太多人吐槽。
同樣出于重量的考量,Vision Pro 通常供電是依靠有線連接,而獨立的電池組件也只能維持 2 小時續航。
Vision Pro 力圖打通現實和數字世界,在沉浸和互通之間靈活切換,彼此融合,這也是為什么它是一臺真正意義上的 XR 頭顯,完全沉浸的 VR,疊加內容的 AR,彼此交融的 MR,都只是它服務用戶的手段,概念之間的區分似乎已經不再重要。
基礎交互上,內置的傳感器識別虹膜,精準確定目光的指向,目光確定方向,雙指捏合確定以激活選定的目標,這種幾乎沒有成本的交互可能比學會鼠標雙擊還要快。
前置攝像頭和傳感器對雙手的精準識別,徹底不需要額外的手柄。干掉手柄這件事情,無疑讓 XR 頭顯類產品交互往前走了一大步。
目光鎖定,Siri 的音頻識別,帶有音頻反饋的虛擬鍵盤,都確保了輸入交互上的自然靈活多樣,而 visionOS 的系統,自然而然地接入了 iOS、iPadOS、macOS 的蘋果軟件生態,則無疑是整個平臺軟件和內容輸出的保證。
同時,Vision Pro 同樣可以調用既有的蘋果硬件,不限于Macbook 系列筆記本,iPhone、iPad 以及妙控鍵盤、觸控板和鼠標。
尤其值得一提的是,前兩年在 iPadOS 和 macOS 上更新的「前臺調度」功能,無疑是 visionOS 的蘋果全平臺生態下軟件交互上的前置應用。這些系統的軟件和服務以更貼合 Vision Pro 的空間計算的拓展性,自然地在空間中延展。
而彌合生態、交互和體驗細節的,則是發布會少有提及的 AI。
在今年的 WWDC 發布會上,幾乎沒有好好說今年大熱的 AI,但是稍加細看,AI 又無處不在,尤其是在 Vision Pro 的系統和軟件當中。
被稱為 Optic ID 的虹膜識別技術 Vision Pro 讓用戶能夠借用眼球虹膜來解鎖設備,這是一種基于 AI 的生物識別技術。而在虛擬空間中「看哪打哪」的交互基礎,同樣是 Optic ID。
而幫助用戶識別周圍環境的 Eyesight 技術,同樣是在傳感器和攝像頭的基礎上,借由 AI 來幫助用戶識別周圍的環境,是否有人出現在周遭,是否要讓進入識別范圍的其他人「被摳圖進入」虛擬環境。
而 Persona 這一功能對于設計師應該很熟悉,「用戶畫像」。借助初始的掃描和傳感器生成的真實人物3D形象,同樣是 AI 加持的,相比于描述化和參數化的「用戶畫像」,Persona 更加直觀具體,并且借助 AI ,更加自然。
之前提到的掃描環境材質構建聲場,讓虛擬場景和真實環境融合的 Spatial Audio 同樣是 AI 技術的加持。
看來算力炸裂的 M2 芯片在 Vision Pro 里確實沒閑著,要識別手勢、優化聲場、識別語音、建模渲染、人物時事摳圖、輸入輔助、還要把語音轉為文本。
而蘋果的這一策略也展現了 AI 真正在應用層面的范式——并非無處不再的輸入框和 prompt,而是合理有機地將 AI 功能融入到點點滴滴的產品功能和細節,結合到輸入輸出交互當中。這樣既能提高用戶的便利性和滿意度,又能保持用戶的主動性和自由度。
今年 AIGC 快速崛起過程中,一直有交互從「GUI 向 CUI(對話式界面)」轉變的說法,我覺得這種轉變在一段時間內、在生產端是存在的,但是真正的范式改變可能會著落在 Vision Pro 所引領的下一個十年上。
「圖形」是為了呈現,指向的是視覺化結果和一圖勝千言的結果。「對話」終究是溝通 AI 和人類的自然語言指令,而所指向的結果理應是不言自明的呈現,或是心領神會甚至超越構想的效果。
所以,ChatGPT 是 AI 行業的「iPhone 時刻」,而 Vision Pro 則應該是面向下一個時代的「iPhone 時刻」。前者是獲得結果的底層技術,后者負責呈現、重塑體驗、空間、行業和生活的那個結果的可能性。
就像 5G 是高速網絡,而借助 5G 網絡在高清屏幕上絲滑看直播,才是我們想要的結果。
從生產端來說,設計、模擬、呈現將會截然不同。在專業的設計領域,鼠標、手繪板和鍵盤快捷鍵驅動下的軟件交互可能會被更加直覺的「手搓」替代,學習成本和認知負荷將會進一步降低。
現實中的全息影像有沒有機會實現我不知道,但是托尼史塔克在三維空間中手搓 MK2鋼鐵俠戰甲的體驗,肯定會有開發者會在 Vision Pro 中替我們搞出來的。
從二維的屏幕進入3D的空間,一切都要重新計算。已經被「高清重置」的數字內容亟待「空間重置」。當現實當中的行業、領域和產品增加了一個新的維度,意味著一場席卷一切的數字空間基建,其中所蘊藏的機會,一時之間恐怕難以道盡。
告別電視,用XR頭顯看有著空間縱深的影視劇集。
隔著千萬里,在自家沙發上第一人稱沉浸式趕海。
搶不到演唱會的內場票,同樣可以享受前排觀看的感動。
在跑步機上一邊刷朋友圈的步數排名,一邊在死亡擱淺的世界里跑圖。
身處世界各地的團隊成員,在 XR 版的 Blender 中用手比劃出角色、建筑、場景乃至一整個世界。
……
這是一場從「在線」到「在現場」的轉變,而這種轉變可能會席卷所有行業。
當然,這一切都建立在 Vision Pro 能夠引領如今的整個數字產品和設計領域真正進入 XR 這一賽道基礎上。
觸發 「iPhone 時刻」的初代 iPhone 并沒有大賣,這并不影響移動端設計和過去 10 年的這一輪繁榮發展。3499美元的 Vision Pro 現在距離每一個普通用戶還有相當的距離,但是它對未來體驗的重塑,讓我在 AI 焦慮下的生活和工作,有了新的期待。
各位,應該是有活兒干了。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
熱評 Young