大家好,我是和你們聊設計的花生~
有關注「神器挖掘機」阿文(微博 @Simon_阿文 )的朋友,可能已經了解到他最近正在瘋狂安利一款 AI 繪畫神器——Disco Diffusion。
這款被阿文稱作“用嘴就能畫畫”的神器,能通過輸入的一段描述語句,自動渲染生成對應場景的圖片。渲染結果質量非常高,高到不說是 AI 自動生成的話,你肯定會覺得是哪位繪畫大神的作品。
更多在線神器戳 ?? http://www.hx168888.com/category/tools-download
先來看看阿文第一次嘗試的結果,輸入關鍵詞是“星空下的向日葵花海”,渲染時間很久,但是出來的效果也足以令人驚嘆。(圖片來源: @Simon_阿文 )
之后阿文又嘗試了中國畫的水墨風格,Disco Diffusion 的表現仍然很好。
圖片來源: @Simon_阿文 ,關鍵詞 ”a beautiful painting of Chinese Shanshui landscape, clouds, ink style, trending on artstation“
在看到阿文的推薦后,微博上很多網友也開始嘗試,并同樣取得了不錯的渲染結果。
圖片來源:微博 @MIGRAINER- ,關鍵詞 ”Among planets, stars and galaxies, an armada of gigantic very long spaceships travels at light speed, detailed,artstation,Chris Foss“
怎么樣,是不是有點顛覆你對 AI 繪畫的認知了?
Disco Diffusion 自發布后,在外網引起了很多藝術家的關注。他們也使用 Disco Diffusion 進行各種嘗試,也誕生了很多優質的渲染作品。
圖片來源: @cosmicWranglerZ ,關鍵詞 ”A BOY TRAVELING WITH HIS CYBERNETIC PACKHORSE SELLING TECHNO ALCHEMY WARES“ 渲染結果,
圖片來源: @x1ao4 ,關鍵詞 ”ancient Chinese village“
可以看出 Disco Diffusion 自動渲染出的圖片無論是色彩還是氛圍都達到非常高的水平,充滿魔幻色彩。作為一個 AI 程序,這一切是如何實現的呢?
Disco Diffusion 是在今年 2 月初開始流行的一個 AI 圖像生成程序,它可以根據描述場景的關鍵詞渲染出對應的圖像,開發者是藝術家兼程序開發員 @Somnai_dreams 。
這款程序的特點在于:它直接托管在谷歌的 Colaboratory 上的,即整個程序是直接在瀏覽器中編寫和運行代碼的。這也意味著使用 Disco Diffusion 對電腦配置沒有要求,因為程序不需要被部署到本地。
Github 地址 ?? https://github.com/alembics/disco-diffusion
Disco Diffusio 程序的首頁
Disco Diffusion 程序的首頁不是我們熟悉的用戶界面,而是一行行看起來很復雜代碼——有點像沒有外殼的機器,將線路零件直接呈現在用戶面前了。
這些代碼就是 Disco Diffusion 整個程序運行下來的所需的全部代碼,而且都已經按步驟分類好了。看起來很深奧,但真正需要我們動手修改參數的地方極少,跟隨網站上的教學視頻你可以很快就弄懂如何操作。
需要用戶修改參數的其中一部分,右邊的界面還是簡單易懂的
Disco Diffusion 之所以有如此強大圖像生成功能,倚仗的是背后強大的機器學習模型。
這個模型并不是簡單地將一堆圖片生硬拼接,而是在基于關鍵詞的基礎上,AI 模型對圖像進行一次次迭代渲染,直至機器判定渲染結果與給定的關鍵詞匹配度最高,渲染結果才會最終確定。
圖片來源: 《How does CLIP Text-to-image generation work?》
這也是為什么我們用 Disco Diffusion 渲染圖像時,畫面最開始都是模糊的噪點,而渲染時間越長,圖片精度就越高。
Disco Diffusion 的圖片生成功能如此強大,那生成圖片的功能可以直接免費商用嗎?
首先,Disco Diffusion 程序基于 MIT 開源協議,即這個程序供所有互聯網用戶免費使用,還可以復制、修改甚至出售。用 Disco Diffusion 渲染生成的圖像,版權歸圖片創作者本人所有。
Disco Diffusion 首頁的「License」中表明程序基于遵循 MIT 開源協議
那生成的圖片可以直接拿來商用嗎?這個問題需要謹慎對待。
Disco Diffusion 如同一位具有極強模仿并融合畫風能力的畫手,人工需要很長時間很多精力才能完成的畫作,它通過模型學習加機器渲染,就能用比人工少很多的時間實現。
使用 Disco Diffusion 渲染的節氣圖,作者: 弈湘君
但 Disco Diffusion 本質上只是通過算法不斷去接近給出的關鍵詞,或者是在幾個關鍵詞中取得一個平衡點,以達到文本規定下最大程度的“相似”。
這些行為都是“模仿”——無論好壞,只要相似度夠高就行了,遠達不到人腦可以有意識進行取舍的程度。
使用莫比斯風格渲染出的圖,風格與原作者非常接近。(圖片來源: @Simon_阿文 )
如果你在給 Disco Diffusion 的關鍵詞中,涉及到風格特別鮮明的藝術家或者商業作品,那么渲染生成的圖像會呈現出非常相似的風格,這樣自然就會涉及到侵權的問題了。
阿文對 Disco Diffusion 圖片是否可以商用的看法,圖片來源 @Simon_阿文
Disco Diffusion 可以輕易渲染出猶如專業藝術家創作的圖畫,是否意味著能夠取代人工創作呢?我們看看專業藝術家是怎么看待這個問題的。
Stijn Windig 是一位來自荷蘭的藝術家,擅長概念設計,作品細節精致,場景恢弘。
Stijn Windig 的部分作品(圖片來源: Artstation )
Disco Diffusion 開始流行后,Stijn Windig 也開始嘗試將 Disco Diffusion 運用到自己的創作過程中。
Stijn Windig 先用 Disco Diffusion 渲染生成各種圖像,然后將圖像導入 PS 放大,以此為基礎在上面進行進一步的繪制。下面是他以這種方式創作的作品:
Stijn Windig 在進行一系列的嘗試之后,將作品分享到 Artstation 上并寫到:
……完善每幅渲染圖像大約需要 1.5 小時。從Disco Diffusion中獲取圖像花費了更長的時間,嘗試了不同的文本提示,直到我得到了一些看起來還比較像樣的東西。
Stijn Windig 還將自己的創作經驗寫成文章發布到自己的 Artstation 博客中,在文章中,Stijn Windig 說到:
……首先,這東西(Disco Diffusion)的存在是有點瘋狂的……它似乎能夠輕易地生成史詩般恢弘的概念藝術。
……當你下載圖片后將其放大,并開始在上面作畫,就會有一種超級失望的感覺,因為事實證明,盡管從遠處看它是一個恢弘場景的圖像,但實際上那里什么也沒有。
……一旦你開始想細化圖像中某個不明確的部分,渲染圖像就失去了其原有的氛圍感了……在試圖 "完善細化 "圖像的過程中,我發現每一筆都不對勁,因為我可以看到圖像變得更加明確,但卻失去了原有的魅力。
……當我第一次發現它時,我試著把它用在一個客戶的項目上,這個項目的特點是環境中有很多建筑元素,我想,"Disco Diffusion能夠幫助我快速完成這幅畫",但是結果并非如此。我發現渲染圖像上的每一處都需要重新繪制,甚至每一個像素都得重新刻畫。因為盡管它可能看起來像一個有城市的山地景觀,但實際上沒有正確的房屋、山垛、植被和其他東西,只有模糊的概括暗示。我在一幅本應一兩天內就完成的圖像上耗費了一個星期。如果是直接創作三維甚至是二維的圖像,我就會更快……
所以這就是 Disco Diffusion 的弱點:如果你想要一些有具體細節的事物,Disco Diffusion 是沒有能力來生成一個細節精細的作品的(至少目前是沒有)。它不擅長刻畫具體細節。
除此之外,它不擅長人物、動物、汽車、透視,或任何需要真正具體特征的東西……
從文章中,我們可以看出,身為專業藝術家的 Stijn Windig 在經過多次實踐后,認為 Disco Diffusion 并沒有取代人工創作的能力,原因有以下幾點:
- 從 Disco Diffusion 中獲取想要圖像并不容易,需要花費大量時間去調試關鍵詞。
- Disco Diffusion 沒有刻畫具體細節的能力,渲染出的圖像乍看驚艷,如果仔細觀察就會發現大部分都是模糊的概括暗示,不能達到商業水平的要求。
- 如果想在渲染圖像的基礎上刻畫細節,就相當于要把整個圖重新畫一遍,這樣一個流程下來花耗費的時間精力,比直接手繪還要多。
不過 Stijn Windig 還是對 Disco Diffusion 的未來發展持樂觀態度,雖然直接利用 Disco Diffusion 渲染的圖像進行商業創作的嘗試失敗了,但將它作為一種靈感參考生成器還是非常好的。
……我發現它更適合作為一個創意生成器使用。給它一個提示,比如"晴天的幻想城市,王座游戲,巨大的城堡",它將返回一些至少能激發想象力的東西,并可以用來在上面繪畫,作為草圖。
根據文本提示渲染出高質量圖像的技術近年來發展迅速,除了我們今天談到的 Disco Diffusion,類似的程序還有 Nightcafe Creator 和 Dream by wobom。
1. 人工智能藝術生成器 NightCafe Creator
「網站」 https://creator.nightcafe.studio/
NightCafe Creator 是一款人工智能藝術生成器應用程序,可以根據你給出文本提示生成多種風格的藝術作品。創作完成后版權歸創作者所有,并可以隨心所欲地使用它們。
NightCafe Creator 還支持將照片轉換成各種風格的圖片,使用這個功能要注意照片的版權問題。
2. 人工智能藝術生成器 Dream by Wobom
Dream 是一款 ISO 應用程序,輸入一個文本提示,選擇一種藝術風格,就能在幾秒鐘內生成一副精美的圖畫。
3. 欣賞更多用 Disco Diffusion 渲染出高質量的作品:
「國內」 點擊此處直達
「國外」 點擊此處直達
「參考資料」
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
熱評 369