其實 6 月 11 日凌晨的 WWDC 24 特別活動,看得我特別煎熬。各個群里、社交媒體上都在等著蘋果的 AI 王炸。壓軸登場時,出乎意料,又在情理之中。周一晚上我精神渙散沒來得及細想,第二天清醒之后,才咂摸出味來。
現場演示的功能,其實沒有那么重要,但是它的存在形式和所指方向,又非常重要。
這篇稿子寫了刪,刪了寫,到現在才擠出來。
姑且把這次 WWDC 上蘋果所「承諾」的,都視作為畫餅。
蘋果一直都是諧音梗大戶。Artificial Intelligence 是 AI,Apple Intelligence 也是 AI。只是別人諧音梗扣錢,蘋果這邊都是加錢上諧音梗。
WWDC 24 的整個特別活動的上半場,介紹了 iOS 18、iPadOS 18、watchOS 11、visionOS 2 和 macOS Sequoia 系統的更新特性,所有和 AI 相關的功能優化,則全部都被合并到屬于 Apple Intelligence 的下半場。
如果蘋果所畫的這個大餅能如期烙成,那么 「AI」—— Apple Intelligence 也算是實至名歸。
蘋果在 AI 賽道上落后,這回找到一個自己熟悉的排水渠,打算排水渠過彎贏回一局,在我看來這個方向是對的。
接近 1 個小時時長的下半段內容,看起來眼花繚亂,但是其中的「AI」可以大致分為 3 類。
一個是圍繞文本內容展開的:
和咱們熟知的很多生成式 AI 類似,Apple Intelligence 同樣可以根據不同的需求,生成不同語氣、不同類型的文本內容,但是它借助專門的菜單,根據系統獲取的背景信息,更好地生成貼合當前用戶需求的內容信息,給出建議。
發布會的視頻當中,現場演示了包括郵件、文檔、iMassage 等多個不同使用場景下,文本和書寫內容生成的效果。
而文生圖或者圖生圖,用過 Midjourney 等工具的同學,就更加熟悉了,在某種程度上,蘋果并沒有顯得「特別先進」。
蘋果是借助獨立應用 Image Playground,來生成動畫、插圖和素描三種風格的圖像,生成的圖片也可以自此,應用于第三方 APP 當中。值得一提的是,Image Playground 是在本地獨立運行,在很大程度上減少對于服務器的依賴。本地運行的 AI 服務一方面降低了隱私泄漏的風險,另一方面也增強了內容生成的效率。
而在「備忘錄」APP 中,用戶可以透過 Apple Pencil 調用 Image Playground,將粗略的草圖轉化為 AI 生成的精美圖像,在這個過程中, AI 會抓取筆記當中的上下文信息,讓生成的視覺內容更加貼合當前語境。
此外,Apple Intelligence 所引入的 Genmoji 功能很大程度上也是借用的同類功能,用戶可以通過輸入文字提示快速生成個性化的 Emoji,用作貼紙和表情分享。相比于固定的 Emoji,Genmoji 生成的表情更加多樣有趣。
但是相比這些相對固定、單一的 AI 應用方式,更為重要的是 Apple Intelligence 的第三種應用策略,也就是指向「個人化智能」的方向, AI 的沉浸式應用。
在「沉浸」的策略之下,AI 隱于其后,成為中間件。
比如這次 iOS 相冊的史詩級更新之后,用戶可以輕松借助 Apple Intelligence 修改照片內的視覺信息和內容。那么,終端用戶——或者說你——真的關心它是借助 OpenAI 實現的,還是用文心一言搞定的嗎?
作為全局助手,Siri 同樣得到了史詩級的更新,它成為了 iOS/iPadOS 的通用交互入口。
在蘋果官方的新聞稿中,是這么寫的:
「在 Apple Intelligence 的支持下,Siri 更加深入地融入了系統體驗。憑借更豐富的語言理解能力,Siri 更加自然、更符合語境、更加個性化,能夠簡化和加速日常任務。如果用戶在單詞上犯了錯誤,它可以跟進,并保持從一個請求到下一個請求的上下文。此外,用戶可以輸入文字給 Siri,并在文本和語音之間切換,以任何當時感覺合適的方式與 Siri 交流。Siri 還采用了全新的設計,當 Siri 處于活動狀態時,優雅的發光燈會環繞屏幕邊緣。」
在這個時候,Siri 不再只是一個無聊的問答機器人,因為被賦予更高權限、更高行動能力和可能性的它,正無時無刻不在試圖更好理解「我」,成為真正意義上的「Her」,這正是很多人理想中的人工智能。
- 理解上下文環境:能夠參考你屏幕的信息,正在發生的事情
- 獲取深入背景信息:能夠跨 APP、跨媒介,來提取更加深入的信息內容
- 跨 APP 執行能力:讓 Siri 能夠借助 APP Intents 、快捷指令,整合執行跨 APP 的操作
- 融入工作流:無縫嵌入當前工作流程,幫你完成多項工作內容
Apple Intelligence 和 Siri 的整合,在龐大的蘋果生態之下(其實谷歌、華為應該也可以),構建起一種有效的、真正服務于普通人的人工智能服務——一種 AI 存在感沒有那么強的、作為中間件的服務。
就像你在用 APP 的時候,壓根不在意它用的哪種編程語言一樣,但是它要幫你達成目標。如果真的實現,相比于 Copilot,Siri 可能更配得上 Copilot 的名字。好的服務就像好的體驗一樣,理應是隱形的。
懂得「人」的 AI 只能算得上是「聰明而世故」,只有了解「我」, AI 才能稱得上是真正意義上的「個人化智能」。因為「我」要的答案,通常需要適配「我」的需求。
看完整場 WWDC24,再重新審視到下半場開頭庫克所說的這 5 個關鍵詞,就開始有了新的意味。
強大,直覺,深度整合,個性化,同時兼顧隱私。前 4 者確保了體驗的優化,而隱私服務的提升,則是在 Apple Intelligence 權力變大的情況下,提供了對等了保障。(起碼蘋果是這么說的)
做 UX 的同學對于這些詞非常熟悉,因為它們就是「以人為中心」設計的核心,并不新鮮,但是要做好并不容易,但是這恰恰過去 50 年中,史詩級數字產品撬動世界的秘密——使用產品的用戶,在使用產品的過程中,獲得了尊重。這也讓我想起一件舊事。
我的朋友總帥,有個「逃離速度理論」。
「某個東西帶你逃離當前困境的速度越快,你越容易上頭……工作太累了,到家拿起手機打一把游戲就能逃離開一切,這不比開一盒模型更快?」
總帥出了模型坑,選擇了逃離更快的手游,作為回避痛苦的鎮痛劑。人總會下意識選擇最短的路徑來環節痛苦,或者逃離困境。而目前的多數 AI 服務還沒法立刻、馬上、有效地幫你逃離,起碼絕大多數的 AI 工具,還遠做不到這一點。
這也是為什么包括 GPT 在內的很多 AI 工具的留存率遠不及預期。因為大家發現老辦法還挺好用的,起碼情緒情感上是這樣的。
所以,發現并總結人類這種「不理智」行為,并以此顛覆傳統經濟學的行為經濟學家理查德·泰勒能在 2017 年拿諾貝爾經濟學獎。他的顛覆點就在于,它不再以「理性人」作為基礎假設,相反人的心理特質、行為特征隨時隨地都會發生變化,這種非理性的、隨機的、多變的、擴散的狀態,才是人真實的狀態。
而這也貼合過去 10 多年互聯網快速發展階段,底層的驅動力,體驗和用戶情緒。回想一下,之前我們所沉迷的好產品到底有什么特質?起碼,其中有一部分,是開發者/設計師和用戶之間的雙向奔赴:我用細節、視覺、功能來實現某種體驗,撓到你的癢處,會心一笑。
按照現在的說法,就是「情緒價值」。
相比于 SD,ChatGPT 和 MidJourney 已經在體驗層面上,做得更棒了,但是我們也都很清楚,好的結果始終是依賴「提示詞工程」的,也就是俗稱「咒語」的玩意。
當然,為了工作,為了工資,為了甲方,你可以一邊罵罵咧咧一邊絞盡腦汁地寫背景信息、微調「咒語」,重復 20 次生成,或者在 100 條文案里面艱難挑選那個你覺得勉強看的過眼的。
但是歸根結底,還是 AI 不懂你,你不得去費勁溝通。在影視劇作當中,這是令人厭煩的「解釋性語言」,在現實生活中,這腳「看場合」和「讀空氣」,在「提示詞工程」中,這是必不可少的「背景信息」。
AI 不會,所以你累。
「提示詞工程」本身是一個「以 AI 為中心」策略,并不符合「以人為中心」的體驗設計原則。
而這也解釋了為什么蘋果和谷歌,或者說,iOS 和 Android 平臺本身如此重要。因為軟件、服務和依托于此的用戶數據就是「空氣」。
一千個人眼里有一千個哈姆雷特,一個「F*ck」在不同語境中可能有一萬個意思。雷佳音曾經在《心花怒放》中將這種差異進行了透徹了演繹,同一個情境之下同一個詞,可以有如此豐富的含義和差異。
正如我們自己能感知到的,絕大多數時候,我們很難保持清醒、富有邏輯、又精力充沛。我們不可能在周一傍晚下班的時刻,看著華燈初上聞著晚飯的香氣,還在在工位上理智平靜清醒思考。行為經濟學家卡尼曼在《思考,快與慢》當中,將我們日常思維模式,歸結為「系統1」和「系統2」,而上面所說的,就是系統1。
系統1是我們的快速、直覺和自動化思維方式。它幾乎無需努力,能夠迅速做出決策,通常基于經驗和潛意識。系統1負責處理簡單的、常規的任務,如認出熟人的臉、理解簡單的語句或立即反應緊急情況。盡管它效率高、反應快,但系統1容易受到偏見和直覺誤差的影響。
系統2是我們緩慢、邏輯和有意識的思維方式。它需要更多的努力和注意力,負責復雜的、需要深思熟慮的任務,如解數學題、權衡利弊或做出長期規劃。系統2能夠糾正系統1的錯誤,但因為需要更多的認知資源,它常常被忽略或在壓力下失效。
目前咱們和 AI 交互都得靠「系統2」,費勁,疲憊。而 Apple Intelligence ,則是想「保2沖1」,穩住「系統2」的基本盤,借助龐大的平臺 APP 體量和龐大的開發者群里以及人工智能,讓用戶能用「系統1」和 AI 共存。
如果 Apple Intelligence 真能落地,用戶也許可以保持住松弛感。問一個簡單的「怎么辦」,就能獲得答案。Siri 可以在迅速理清現狀后給出答案:
- 「向前走,抬起頭,深呼吸,然后對她說我愛你。」
- 「識別到你在 2 樓男廁第三個坑位,已向最近便利店下單衛生紙,外賣小哥會在 5 分鐘內前來搭救你,堅持住!」
- 「乖,摸摸頭,別擔心,一切都會好起來的。」
- 「收拾東西,下班就好了。」
- ……
WWDC24 特別活動的下半場確實值得仔細看看。
這對于做 UX 和做 AI 的同學都很重要。我相信周一晚上很多看直播的很多大廠的同學/獨立開發者,應該是等不及結束,就已經開始去蘋果的開發者網站上去找文檔看看了。抄到了解題思路,接入了平臺的服務,大家就不用反反復復地造輪子了。
大概率 OpenAI 的服務沒法在今年 9 月前,在大陸地區合規地隨著 iPhone 16 系列隨機附贈,但是文心一言、通義千問們,應該已經和蘋果的同學緊鑼密鼓地接洽和談判了。但是,普通用戶,要的是一個結果,而不是存在感過強的某款 AI。
而這可能是 AI 真正意義上,潤物細無聲地和最普通的用戶擁抱的起點。
更重要的是,這是個機會。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
熱評 名字長才能吸引你注意