編者按:雖然這是一篇大概 1 年前的舊文,但是 AI 在用戶體驗層面的發展并沒有如同我們預期一樣發生快速的、根本性的發展,所以這篇來自 Tony Jin 的文章,價值還在提升。值得一提是,Tony Jin 供職于 Google Assistant 團隊,在用戶體驗、語音交互、AI 領域有足夠深入的了解和經驗。
現如今,有關生成 AI 的新聞到處都是。用戶談論 ChatGPT 如何在創紀錄的 5 天內達到 100 萬用戶,高盛如何預測 AI 將影響 3 億個工作崗位,以及新版必應的 "失控"......
拋開所有的熱搜話題不談,作為一個設計數字助理、擁有人機交互背景并熱衷于為新興技術進行設計的設計師,這對我個人來說是一個激動人心的時刻。
生成式 AI 的突破,就像我們發現電的那一刻一樣重要——雖然整個技術可能還需要幾年的時間才能真正成熟(雖然速度正在加快),但我們知道,我們可能剛剛踏上了一塊重要的基石,開啟了許多可能性,業內的每個人都在努力探索著這些可能性。
事實上,到底有哪些可能性?我們又該如何更好地利用生成式 AI 的特性,并回避其缺點呢?
在這篇文章中,我將嘗試解讀我作為一名設計師,在使用了數十種生成式 AI 工具之后的心得體會。我將討論良好的輸入方式,對于生成式 AI 的重要性,以及語言作為輸入介質的局限性,以及我們如何利用最佳實踐,來彌補這些局限性,并使生成式 AI 對用戶的日常使用真正產出價值。
我們已經看到了人工智能的爆炸式發展,它們可以生成語言、藝術作品、音樂、完整的演示文稿、代碼,甚至是公眾人物的播客訪談(也可以試試史蒂夫-喬布斯式的風格?)
看著這些幾個月前還讓人匪夷所思的新功能,我們可能很容易產生這樣的錯覺:不久之后,我們只需說幾句話,生成式 AI 就會施展魔法,創造出無懈可擊的解決方案,完全符合我們的想法。
然而,事實并非如此。
是的,如果你想為自己的企業創建一個 LOGO,又不想聘請專業的 LOGO 設計師,你也許可以通過 Midjourney 中的一些提示和迭代,來創建一個還湊合的 LOGO。但它只適用于你想潦草完成的情況。
但是,如果你對 LOGO 的外觀和風格有具體要求,那么你可能需要對提示詞進行多次潤色,才能使其接近你想要的感覺。
這相反需要大量的人工測試和來回編輯,不是三言兩語就能完成的。
這是因為在我看來,使用生成式 AI 的最重要規則之一是:輸入質量決定輸出質量。下面的例子是我給 ChatGPT 的一個通用提示:
由 ChatGPT 生成的郵件,提示詞是“告知我的團隊我正在做事情”
ChatGPT 天馬行空地發揮想象力,竭力把事情具體化,卻只輸出了一封充滿陳詞濫調廢話的郵件,這其實很有趣。這讓我想起了我在 reddit 上看到的一個帖子:
AI 成為我們的廢話生成器和廢話解碼器,這真是一個辛辣的諷刺。
“AI 將我這個簡短的總結轉化成一份超長郵件,并且假裝是我寫的?!?br /> “AI 可以將這份超長的郵件總結為一句話,這一我可以假裝看過了?!?/p>
這不能怪 ChatGPT,因為我給出的提示詞確實很糟糕,其中沒有包含太多的信息。我沒有說明郵件的風格、長度、我和團隊之間的關系,我也沒有提到和現有項目相關的任何細節,等等。我腦子里可能有這些背景和信息,但如果我不說出來,ChatGPT 永遠也不會知道。
而這正是具有挑戰性的部分——用戶需要知道如何傳達足夠的上下文信息,以便 AI 能利用好這些信息,這才能節省我的時間,并提供我需要的輸出內容。
要知道如何 "設計 "提示詞,向 AI 模型準確傳達我們的想法,其實是一件很難的事情。我們自己的語言,比如英語,天生就不擅長給出精確的指令。這也是我們創造具有嚴格語法的編程語言的初衷之一,以便將我們的想法明確、高效地傳達給計算機。
"代碼是我們設計的界面,用來給計算機編程。這是我們所需要的。它客觀、清晰、明確、(相對)靜態、內部一致且穩健。
英語不具備這些特性——它是主觀的,意義往往是隱晦、模棱兩可的,它總是在變化,甚至自相矛盾矛盾,文本的結構經不起推敲"。
——道森-埃利亞森:"英語是一種糟糕的編程語言"
因此,即使是人類,每天也會誤解對方。我們可能需要多次解釋自己的想法,如此反復,才能讓別人完全理解。很多時候,我們還需要借助外部工具,如白板圖或者非常詳細的文件,來解釋我們的整個思維過程,以達到同頻一致的目的。
我們需要對 AI 進行同樣的處理。
我們可以通過一些方法來設計和微調 AI 工具,避免出現問題。與其讓用戶誤以為 AI 工具可以 "讀懂你的想法",我們不如把它視作為一個強大的合作者,或者像微軟所說的那樣,一個可以輔助你完成工作的 "副駕駛"。設計和構建 AI 工具的人也應該提供手段,幫助用戶在日常使用中,精確而高效地與他們的 "副駕駛 "溝通。
在為生成式 AI 進行設計時,需要注意以下幾點。
提示詞工程可以很有趣,甚至提示詞工程師已經成為一份年薪可以達到 33.5 萬美元的工作。不過,我認為,這些工作的存在,只是為了讓“專業”的提示詞工程師,能夠替代普通用戶完成艱苦的提示詞創建地工作,從而避免普通用戶需要專門學習一門“AI語言”。
相反,我們可以讓普通用戶通過預設地問題/類別,來輸入和描述他們正在尋找的內容和答案。有了這些信息,系統就能代表他們生成更完善的提示,從而最大限度地提高 AI 產出有效結果的幾率。
這對專注于垂直領域的產品,尤其有幫助,我們可以建立一套預設地問題,這在大多數情況下都很有幫助。
例如,HomeByte 可幫用戶生成待售房屋的裝修效果圖,讓用戶構思新家具和新風格裝飾下的硬裝和軟裝地效果。它讓用戶使用預設的 UI 元素來選擇風格、房間類型和色彩主題,然后生成生成 AI 模型的最終提示詞。它還會向用戶公開提示詞細節,以便進階用戶自己進行微調。
來自 HomeByte
這是第一點的延伸。提供限制是唐-諾曼(Don Norman)提出的七大設計原則之一。這聽起來可能有違直覺,但很多時候,限制用戶的選擇,而不是給他們一個空白頁(讓用戶從零開始撰寫他們自己的提示詞)可能會更有效。
Story AI 就是一個很好的例子,它在為用戶生成故事創意之前,會詢問用戶一些輸入地信息。其中包括故事風格、主角信息、故事背景、主要沖突以及對故事的其他特殊要求。
摘自 Story AI
這些選項促使用戶考慮輸入內容地方方面面,以確保輸入提示詞足夠全面,從而確保 AI 能夠高質量地輸出。
提供詳細、高質量輸入的另一種方法,是利用現有的內容作為輸入,然后讓 AI 對其進行細化、格式化和風格化。
Google Workspace 和 Microsoft Office 最近發布的視頻都強調了這種情況。
例如,你可以在手機上寫一封郵件的草稿,無需考慮格式,讓 Gmail 為你正式處理。
基于幾個要點,撰寫正式的電子郵件 - Google Workspace 中的 Gmail
或者把昨天的原始會議記錄(記錄了團隊的所有想法)用 Microsoft Word 轉換成提案。
根據會議記錄起草提案 - Microsoft Office 365 中的 Word
在我看來,這是人類與 AI 之間的一次偉大合作,但是人類仍然負責內容。畢竟,生成式 AI 是一個推理引擎,而不是一個知識庫。如果沒有內容作為基礎,它所能做的只是幻覺和編造。但是,有了人類提供的內容,即使是原始形式的內容,AI也能將其風格化,使其變得更棒。
即使有約束條件和良好的內容輸入,AI 可能仍然很難一次就完全準確捕捉到用戶的意圖。因此,在設計 AI 工具時,最好能提供幾個選項,讓用戶挑選自己喜歡的來進一步完善。
"沒有想象力的世界 "由 Midjourney 生成
谷歌 Bard 生成的多個草稿
"數量重于質量 "也是頭腦風暴的原則之一。因此,"生成式 AI "的妙用之一就是提供各種選項,激發用戶的靈感,而不是一蹴而就地創造出最終解決方案。AI 生成的內容應該被視為靈感參考,而非必須遵循的神諭。
這也是我們可以利用 AI 模型的 "缺點" 又價值的地方:由于語言的局限性,我們很難期望 AI 完美無瑕地執行我們的想法,相反,我們可以利用 AI 模型生成所帶來的隨機性。AI 模型對信息的 "誤讀 "可能會帶來偶然的創造,不完美的產出會拓展我們的視野,鼓勵我們探索未知的新道路。
即使可以生成多個結果,AI的生成通常仍是一個起點。最終,用戶具備控制和微調的能力(控制也是 Jakob Nielsen 提出的 10 個可用性啟發式之一)。
在 ChatGPT 中,你可以要求它使用新的約束條件重新生成回復。不過,由于 AI 模型生成內容的概率屬性,以及語言缺乏精確性的問題,導致這可能是一個挑戰。
由 ChatGPT 生成
在上面的例子中,ChatGPT 可能沒有理解我所說的 "保留隱喻 "的意思(我說得也很含糊)。在我第二次提示后,它重新生成了整個內容,而我只是稍微改動一下措辭。
僅通過提示詞很難讓模型一次又一次地生成令人滿意的內容,這可能會導致用戶在 21 次迭代后最終放棄,這個體驗是極度令人沮喪的。
但另一方面,我們也可以設計一個工具,讓用戶自己編輯回復,或選擇部分回復,通過直接操作,來隔離需要修改的內容,甚至在 AI 的幫助下進一步完善回復。
Notion 允許用戶對生成的故事進行微調
這對生成文本來說很容易,因為它們可以隨時編輯。不過,Adobe Firefly 的早期預覽顯示,它也可以隔離圖像的某些部分,讓用戶根據自己的需要對結果進行微調。
Adobe Firefly 的早期效果圖
即使是在與其他人合作時,這些來來回回的修改也很常見,尤其是在合作的早期階段。隨著時間的推移,我們會逐漸了解對方的工作風格和喜好,更容易建立共識。
設計精良的 AI 系統也應如此,通過隱式和顯式輸入了解用戶的習慣和偏好。
目前的 AI 工具通常只允許用戶就輸出的內容質量進行評價,目的是改進模型本身,而不是為用戶的需求,進一步個性化和提升大模型。
Bard 的用戶反饋選項
目前,為每個用戶創建個人模型的成本可能相當高,但在未來,我們可能會逐漸看到這樣的模型:它們從與用戶之前的互動中學習,并隨著時間的推移學習用戶的偏好和風格,從而生成更加個性化的回復,更少嘗試的次數,更好滿足用戶的需求。
生成式 AI 是熱門話題,媒體的狂熱吹捧可能會讓用戶對它的功能,產生不切實際的期望。然而,重要的是要記住這幾點:
- 對于生成式 AI,輸入質量決定輸出質量。在可能的情況下,為用戶提供選項/限制,并提供高質量的提示詞給用戶做參考。以人們已經創建好的現有內容為基礎,借助 AI 的超能力來對其進行完善。
- 語言是不精確的,AI 大模型生成內容又是具有概率性的。如果用戶有疑問,可以提供多個草案,供用戶在此基礎上進行構建——更多的選擇甚至可能會以偶然的方式,激發用戶的靈感。允許用戶通過直接操作來編輯結果,以彌補語言的局限性。
- 從長遠來看,要學習并適應用戶的習慣,使協作更加無縫。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 4 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓