最近 AI 創作內容火爆網絡,讓我們看到 AI 在設計上充滿想象力的未來。關于 AI 在設計上應用的探索由來已久,從早幾年的智能廣告素材,智能 Logo 再到如今的 AIGC,AI 的成長突飛猛進。本文嘗試梳理 AI 目前在設計領域應用的最新進展,展望設計行業在 AI 技術影響下可能發生的變革。
更多AI落地干貨:
1. 自動化內容生成(AIGC)
從文本-圖像、文本-視頻、文本-3D 模型到智能字體、智能文本,AI 在各類內容的創造上已經突飛猛進,強大到讓人驚嘆地步。
① 文本-圖像技術
近一兩年以來,各大平臺推出的 AI 繪畫工具,用戶只要通過簡單學習,輸入文本,進行關鍵詞調教,即可生產各種風格的畫作。關于文本-圖像的原理可粗略分為文本理解和圖像生成兩個部分,目前主流的 AI 繪畫工具,文本理解部分大多基于 CLIP 模型,圖像生成部分大多基于 Diffusion 模型。相較之前的技術,AI 在關鍵詞理解和生成畫作的多元性有了大幅提升。下邊簡要為大家介紹最受歡迎、效果也最出色的 4 款 AI 繪畫工具的特色,關于每種工具使用教程以及如何生成高質量作品,大家可以自行研究。
Disco Diffusion
Disco Diffusion 是發布于 Google Colab 平臺的一款開源免費的繪畫工具,可以在 Google Drive 直接運行,也可以部署到本地。Disco Diffusion 在生成圖前需要完成一些基本參數設置,好處是可以按定制方式生成圖片,缺點是交互不如其他幾個工具便捷,操作較為復雜,生成時間也比較長。Disco Diffusion 擅長抽象氛圍圖,色彩華麗豐富,但在人像生成上效果不太理想。
描述“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”
圖片來源:@x1ao4,關鍵詞 ”ancient Chinese village“
Midjourney
Midjourney 是一款部署在 Discord 上的繪畫工具,需申請測試資格,在收到邀約郵件后,加入 Discord 頻道,即可通過關鍵詞輸入完成繪畫。它的優點在于操作非常簡單,用戶僅需通過關鍵詞輸入即可完成作畫,不用設置其他參數。它支持在生成圖片后,在已生成圖片基礎上進行調整。初次加入會贈送免費體驗資格,額度用完以后就需要按月/年付費完成繪畫。
Midjourney 對關鍵詞理解出色,無論出圖速度和完整度都優于 Disco Diffusion,而且它對各類藝術風格模仿較為出色,通過設定風格,可以有幫助 AI 更好理解你想要的畫作效果。
來自 Midjourney 的一組對知名藝術家風格模仿的畫作
最近發布的 V5 版本在細節上又提升一步,寫實效果堪比照片,同時支持更多風格選擇,也解決了之前 AI 手部表達錯亂問題。
DALL-E 2
Dall-E2 是由 OpenAI 實驗室發布的,目前也處于內測階段,可在官網上申請體驗,但開放體驗資格有限。注冊后首次會免費獲贈生成機會,額度用完后需要按次付費生成。它不僅操作簡單,而且可控性比較強,但目前圖片比例是固定 1:1 方圖。DALL-E2 可以根據描述生成一幅畫,如果對圖效果不滿意,可以針對該圖生成 3 張新的圖片。而且如果對圖片局部不滿意,它可以支持選擇不滿意部分,單獨設置關鍵詞后再生成。此外,它還可以根據描述對現有圖像進行編輯,以及按給定原圖生成同一風格的不同畫像。
按描述“一個宇航員+騎馬+超現實風格”生成的畫
按描述“選一個位置加一只火烈鳥”生成的畫
根據戴珍珠耳環的少女風格生成的畫
Stable Diffusion
Stable Diffusion 是開源免費的,使用起來相當親民。使用渠道多樣,可以在官網、Google Colab、本地部署等方式使用,官網會默認給你點數,生成圖消耗點數,消耗完成需要充值使用,但通過 Google Colab 或本地部署基本可以不受數量限制。它可控參數豐富,功能齊全,滿足各種個性化需求,因此使用范圍最廣。而且 Stable Diffusion 支持插件,很多第三方在源代碼基礎上進行了 2 次開發,比如有的團隊就發布程序,讓用戶可以使用自己提供的圖像訓練 Stable Diffusion,形成個性化數據模型,生成帶有自己風格的圖像。Stable Diffusion 在抽象的氛圍感上可能不如 Disco 和 Midjourney 出色,但它的想象力和創作力非常豐富,風格多樣,人物寫實。
Stable Diffusion 官網示例圖
AI 繪畫工具吸引了大量用戶進行嘗試,他們形成了各自的社區,彼此分享作品、交流創作過程。雖然很多時候 AI 畫作效果不錯,但目前仍有一些待解決問題:
- 生成的結果會有一些隨機性,無法按照嚴格需求的方式生產;
- 關鍵詞描述對最終效果影響較大,對關鍵詞的描述技巧需要慢慢摸索;
- 如果對內容一致性要求比較高的話,需要對模型進行訓練,有一定的技術挑戰。
② 文本-3D 模型技術
在 Text-Image 技術基礎上,各大科技巨頭都紛紛入局嘗試 Text-3D 技術,目前公開了研究論文和初步效果的技術主要有:Google 推出的 DreamFusion、NVIDIA 的 GET3D、Meta 的 MAV3D,還有 OpenAI 的 Point-E。這項技術還處在初期發展階段,有很多不完善的地方,比如缺乏幾何細節、缺乏紋理,在合成過程智能使用神經渲染器,3D 軟件沒法通用等問題。還有一個普遍的缺點,就是生成速度緩慢,生成單個 3D 模型的常常需要數個小時。而 OpenAI 推出的 Point-E 僅需幾秒到幾分鐘就能產出一個 3D 模型。英偉達的 AI 科學家 Jim Fan 在推特上表示,Point-E 的生成速度約能達到 DreamFusion 的 600 倍。
OpenAI 生成的 3D 模型
DreamFusion 可以在任意角度、任意光照條件、任意三維環境中基于給定的文本提示生成模型
③ 文本-視頻技術
文本生成視頻技術也是建立在文本圖片技術基礎之上,它主要是通過文本圖像對和無文本視頻來學習,根據文本理解生成幾個關鍵幀。建立插幀模型,基于關鍵幀補充關鍵幀之間的圖片,提高視頻流暢度。最后再進行每幀分辨率的提升,提高整體的視頻質量。AI 在文本生成視頻的技術相對較新,Meta/Google 在去年 10 月分別官宣對應的視頻生成器 Make-a-video/Imagen Video,目前只公開了研究論文和幾個官網示例,但得益于文本圖片質量的飛速提升,可以預期很快圖片視頻技術也將大幅提升能力。
Google Imagen Video 生成“一個開車的熊貓”
雖然目前通過文本生成視頻技術只能生成簡單的變化或動作、無法生成基于文本描述的細節以及多場景復雜故事的視頻。但通過 AI 對視頻內容進行智能處理技術,已經有很多讓人驚艷效果,這部分在本文第 2 章節詳細展開介紹。
④ 智能字體
日本筑波大學開發了一套以人工智能為基礎的漢字字型設計系統,可以讓原本需要人工設計上萬字的流程,縮短為只要完成五個手工漢字的設計,AI 就可以自動生產超過 14,000 個相同字體的漢字。
該系統通過學習大量已有字體,再從這幾個手工設計的字體范例中提取特征,通過調整參數值輸出為新的字型。而且它使用的是矢量圖,可以將其輸出為字體文件,讓字體制作所需的時間大大縮短。
2. AI 特效及內容處理
① AI 視頻特效
視頻風格化
在線視頻編輯網站 Runway 于最近發布了 AI 視頻處理工具 Gen-2,該工具針對視頻處理的能力很強大,不僅可以通過文本、文本+圖片、圖片生成視頻,還可以對視頻進行各種風格化處理,比如只需要把你想要疊加的風格用圖片或者文字疊加上去,可很快按要求生成風格化的視頻。
原視頻通過添加一張驅動圖像即可生成風格化視頻
智能 CG 角色替換
由《頭號玩家》主演 Tye Sheridan 創立公司推出的 Wonder Studio 是一個可以為上傳的 CG 模型自動制作動畫、HDR 打光、合并到真人場景的 AI 工具。
② AI 圖形特效
智能編輯
Adobe 最近發布了 AI 編輯工具 Firefly,雖然目前可體驗功能僅有圖片生成、文字效果 2 項功能。但根據介紹來看它具有強大的圖片編輯能力,包含隨手涂鴉作畫、上傳草圖即可生成矢量字體文件、一鍵修改畫面場景、關鍵詞生成設計模板等等能力;
智能生成
NVIDIA Canvas 早于 Adobe 發布了自家的涂鴉出圖能力,幫助設計師加快概念圖創作探索,并騰出更多時間進行創意表達。用戶通過調色板繪制簡單的形狀和線條,AI 模型會在屏幕上實時呈現出與之相呼應的風景圖像。用戶可以通過切換材質來自定義圖像效果,Canvas 提供 9 種風格的可視化效果和 20 種不同材質,比如將雪地改為草地,圖像將呈現從冬日仙境變為熱帶天堂的視覺感受。
③ AI 輔助 UI 設計
AI 生成 UI 版式
近期已經有團隊開始實踐在 AI 輔助下的 UI 設計。比如 Habitable 開發的 Figma 插件“AI designer”,在展示視頻里,它可以通過一段描述生成復雜的頁面。
AI 生成內容素材
Microsoft Designer 是一款智能生成圖文內容的設計工具,搭載 Dall-E2,根據用戶輸入文字指令,可以為用戶自動生成設計素材,如社群貼圖、營銷 Banner 等高質量的排版。
3. 塑造虛擬人
虛擬人是近年很火的領域,虛擬人應用前景廣闊,如虛擬偶像、助手、主持人等等,是未來虛擬世界最重要的存在之一。如何塑造虛擬人的人格化特征,實現虛擬人功能,背后都依托的是 AI 技術的加持。
在虛幻引擎最新發布會上,發布了 MetaHuman 新功能 Animator。它可以讓你使用 iPhone 或立體頭戴式攝像機(HMC)在 MetaHuman 角色上以高保真動畫的形式重現任何面部表演。有了它,你就能捕捉到演員表演中的個性、真實感和保真度,將每個細節和微妙變化轉移到任意 MetaHuman 身上,在虛幻引擎中為他們注入生命力。
1. 助力設計師表達創意
設計師可以將 AI 工具應用在工作中,比如當需要探索視覺概念時,可以使用簡單的文本說明生成一些素材供創意師提供靈感和參考;還可以借助 AI 將已有素材嘗試其他不同風格元素,探索可能性;再有就是利用一些 AI 圖形處理工具,快速生成系列內容比較篩選。
比如,數碼藝術家 Karen X Cheng 和時尚雜志《Cosmopolitan》團隊一起創造了首個由 AI 生成的藝術封面。雖然渲染這張圖片只用了 20 秒,但團隊為了達到更滿意的效果,將大量時間投入到創意方向的討論和關鍵詞的挑選與組合上,他們嘗試輸入了數百次創意關鍵字組合進行調試,最終找到了想要的效果。
使用提示詞 “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”生成的幾組圖像
使用提示詞 “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art.” 生成的最終封面效果,
2. 提供更新穎的營銷方式
AI 如今也成為廣告營銷領域必不可少的工具,通過 AIGC 或 AI 內容編輯功能,來實現營銷內容的個性化、可互動性等特征,來強化產品吸引力,提升品牌形象。
亨氏 AI 番茄醬
番茄醬品牌亨氏 Heinz 去年借助 AI 自動生成圖像的話題制作了趣味性的廣告,向廣大消費者證明了人工智能更喜歡亨氏番茄醬的事實。廣告中,亨氏利用 Dall-E2,輸入“蕃茄醬”后,AI 自動生成了一款有亨氏經典外型包裝的番茄醬。當繼續輸入“文藝復興番茄醬”、“印象派番茄醬”、“外太空番茄醬”等更復雜的文字指令時,生成的圖像結果無論在風格上如何變化,所呈現的番茄醬外型和 LOGO 位置都與亨氏番茄醬極為相似,這也印證了廣告中的那句話:“連 AI 都認為番茄醬就是亨氏”。同時,亨氏還邀請了世界各地的粉絲參與到用 AI 創作番茄醬的活動中,粉絲們通過輸入各種詞匯,生成怪異、有趣的番茄醬圖像,并發布到網絡,亨氏將其中較為出色的案例分享到了官方社交平臺,利用 AI 生成視覺效果的熱點,成功幫助品牌進行了推廣傳播。
QQ 音樂 MUSE AI 具像化歌曲海報
AIGC 已經遍布 QQ 音樂的各處細節中,從聽歌體驗、視覺呈現、社交分享等多個維度,做了不少有趣的創新嘗試。與以往的歌曲專輯封面播放不同,QQ 音樂新上線的 AI 播放器是國內音樂行業首個在 AIGC 領域運用的視覺嘗試,其原理是通過在 AI 工具輸入關鍵詞,讓 AI 算法組合各種元素,生成有創意的播放器風格?,F在,QQ 音樂已推出機械裝甲、雪山白、積木游戲、工業灰等 6 款供用戶選擇,據悉還將結合場景,有更多樣式可以期待。
3. 擴展品牌語言
設計師可以尋找更具創造性的方式與 AI 合作,比如創作品牌語言。杰西卡·沃爾什 (Jessica Walsh) 使用 AI 為虛擬核能影響者 Isodope 創建品牌語言,將核能重新塑造為一種向善的力量。Isodope 是巴西模特伊莎貝爾·博梅克 (Isabelle Boemeke) 創建的在線角色,目標是利用 Isodope 超凡脫俗的形象和創意風格在 TikTok 上吸引人們的注意力,來改變人們對核能爭議的看法,倡導將核能作為解決氣候變化和能源緊缺的手段。
Isodope 的品牌元素和排版完全由 AI 打造,Walsh 團隊將創意想法通過 DALL-E,創造出一種全息插畫風格的品牌語言,通過易于分解的視覺元素和前衛的風格表達來緩解人們對核的恐懼,Walsh 說:“你必須推動這個工具并學習如何與它對話,才能產生更復雜、更有趣、感覺更原始的東西?!?DALL·E 還幫助品牌創建了各色貼紙,以便于創建社交資產。借助 AI 使 Isodope 團隊圍繞核能概念擴展和創造更多的品牌元素。
4. 打造全新的交互方式
依賴于 AI 支撐的虛擬人和 Chatgpt 能力,未來人們面向虛擬世界的交互模式將由原來的文本、圖片、視頻等內容升級為擬人化的互動方式。這將大大提升虛擬產品互動的友好性,同時提升用戶對虛擬產品的情感鏈接。
日本便利店巨頭羅森(Lawson)在東京開設首家配備虛擬店員的“Green Lawson”門店。接待顧客的為顯示屏上的虛擬店員,一項研究數據表明,它通過線上發放優惠券領取率是 10%,通過人發領取率為 70%,而通過虛擬人發領取率為 57%,可見未來這種交互方式在商業領域的廣闊前景。
很多人看到 AI 的發展現狀,不免擔心 AI 未來會在很多方面取代設計師。事實上大可不必如此看待問題,AI 雖然在圖像生成、圖像編輯和插圖排版等方面有著讓人贊嘆的效果。但就目前來看,它的內容生成還存在很多問題。即時 AI 在將來內容生成上已經爐火純青,在情感表達、創意等很多方面,AI 還需要人的調教和指導才能產生很好的價值。
得益于 AI 在設計領域的快速發展,人工智能勢必會大大簡化設計師的工作,提升設計師處理各種圖像的效率。設計師也不必將時間浪費在去除背景等費力、重復的任務上,并且將有機會以最少的努力探索更多創意。學習和研究 AI 在設計上最新的能力,將這種能力找到一個很好的契合點,應用在項目中,必將為為項目帶來不一樣的亮色。
參考文獻:
- AI 藝術的背后:詳解文本生成圖像模型 | 集智俱樂部
- 極市開發者平臺-計算機視覺算法開發落地平臺
- 如何通俗理解擴散模型?- 知乎
- 一起用 AI | AI 工具導航 | AI 教程 | AI 集合 | OpenAI
- 建模師也危險了?OpenAI 公布 Point-E,AI 邁出“生成 3D 模型”第一步 | 游戲大觀 | GameLook.com.cn
歡迎關注作者微信公眾號:「騰訊ISUX」
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 5 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓