熱評 一只正在上優設的熊貓

Ai越來越真,現實卻越來越假

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

大家好,這里是和你們一起探索 AI 繪畫的花生~

Midjourney 的 v6 模型終于在 2023 年結束之前更新出來了,這是一個完全重新訓練的模型,所以圖像生成效果與之前的 v5.2 相比有很大的不同,那么此次更新主要有哪些特點?我們又應該如何正確地用 v6 模型出圖呢?今天就帶大家一起了解一下~

上期回顧:

首先是 V6 的圖像生成質量相比之前的模型來說又提升了不少,在畫面質感以及細節刻畫上有了更精致的表現,圖像的光影處理也比 v 5.2 更真實自然。下面是分別用 v5.2 和 v6 生成的特寫圖像,通過對比可以看出 v6 的細節更銳利明確,不像 v5.2 那樣有種灰蒙蒙的感覺。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

另一個更重要的改進是 v6 模型對文本提示詞的理解。一方面是 v6 模型可以理解更長的文本提示了,提示詞容量達到了 350-500 個詞,而 v5.2 中超過三十個詞后,提示詞就不起作用了;另一方面是 v6 對語義的理解也更準確,它可以正確呈現提示詞內提到所有元素,以及元素的顏色、位置以及互相之間關系。v6 還支持自然語言描述,所以提示詞不要需要全部都用短語,這都讓我們可以更輕松準確地生成自己想要的內容。

我們來看幾組提示詞,感受一下 V6 在語義理解上的進步。

首先是有關“雙重曝光”主題的圖像,提示詞比較簡單“Side view of a woman, giant flower, double exposure, surreal photography 女人側影、巨型花朵、雙重曝光、超現實攝影”,通過對比可以看出 v6 對雙重曝光的理解更準確,而 v5.2 的圖像只是一個攝影作品,沒有體現出雙重曝光的特效。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

之前我嘗試在 Midjourney 中生成“一個男孩飄在空中,一只手向前伸出”這樣的指定動作,嘗試了很多次效果都不太好,這次用 v6 試了一下,生成指定動作的成功率要比 v5.2 高不少,同時人物整體的姿態也更自然了。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

然后是對于復雜提示詞的理解。我特意在提示詞寫了很多物體,包括木頭桌子,白色的花瓶、黃色的玫瑰、紅色的碗,還有多種水果,并描述了它們之間的位置關系。從生成結果來看,v5.2 沒有準確呈現碗的顏色,在提示詞中位置靠后的蘋果、藍莓這些元素也都丟失了;而 v6 則準確地生成了不同顏色的物體,位置關系正確,也沒有出現元素丟失的情況。

A photo-realistic photo of a wooden table with a white vase with yellow roses. Next to it is a red bowl with lemons and apples, with some blueberries scattered around the side of the bowl. Next to the table is a white window. --ar 2:3

這是一張木桌的寫實照片,桌上放著一個白色花瓶,里面插著黃玫瑰。旁邊是一個紅色的碗,碗里有檸檬和蘋果,碗邊散落著一些藍莓。桌子旁邊是一扇白色的窗戶。--ar 2:3

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

V6 模型還有一個重大進步——支持生成準確的英文文本內容,操作方法是在寫提示詞的時候,用英文的雙引號將文字內容括起來,比如「a neon sign with text “UISDC”」。生成文字內容時,最好選擇 style raw 模式,或者設置較低的 stylize 值,因為 stylize 過高會導致文本內容扭曲。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

除了新的 v6 模型,Midjourney 其他的參數和命令功能也有對應的調整。

首先是對于 v6 模型來說,--ar、--chaos、--weird、--tile、--stylize、--style raw、Vary(subtle/strong)、Remix、/blend 這些參數和命令是可以正常使用的,但是 pan、zoom out、vary region、/tune 等功能則要晚一點才上線,并且性能上也會進行優化。 /describe 目前也可以使用,但之后會有一個 v6 的新版本推出。

V6 版本的圖像放大選項則是變成了 Upscale(Subtle) 和 Upscale(Creative),二者都可以將將一張圖像放大 2 倍,區別在于 Subtle 放大的圖像會與原圖非常相似,只在細節上會有細微變化;而 Creative 放大后的圖像則會在細節上與原圖有明顯的不同,這個大家按實際需求選擇就可以了。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

V6 模型上線后,很多小伙伴都反映說同樣的提示詞 v5.2 和 v6 出來效果完全不同,這是因為 v6 是一個重新訓練的模型,它的圖像生成算法與 v5.2 有很大的不同,所以我們需要重新學習其提示詞的寫法。

但目前也沒有一套確定的提示詞規則可以作為參考,因為目前的 v6 是 alpha 測試版,在未來一段時間它的還會發生一系列的重大變化,所以在完整版確定下來之前,我們只能自己先摸索。我總結了一些官方以及網友給出的建議,大家可以做為參考:

  1. v6 模型對提示詞非常的敏感,所以在提示詞中不要使用“安慰劑”詞語,比如“獲獎、逼真、4k、8k”等,它們并不能優化圖像質量,反而還會干擾畫面內容的生成。
  2. 想生成更真實自然、更偏向寫實攝影的圖像時,可以使用 --style raw 參數;如果是想生成藝術感和美學性更強的圖像,可以調高 --stylize 的數值。
  3. v6 模型對提示詞的理解變得更準確了,但這也讓它顯得有些“呆板”,因為對于沒有提到的內容 v6 都不會呈現,不再像 v5.2 模型那樣會自由發揮。前面我們提到過 v6 的提示詞容量現在變大了,所以對于想要在畫面中呈現的內容,如主體、顏色、細節、構圖、風格等,一定要詳細的描述出來。
  4. 如果畫面中沒有出現自己想要的內容,可以通過一些方法找回,比如檢查是不是遺漏了對應的關鍵詞;將重點詞語移到提示詞靠前的位置;檢查是否有一些不太重要的詞語,將它們移到靠后的位置或者刪除;以及換一種表達方式,比如將 big 換成 huge/giant,two 換成 a couple 等,讓用詞盡量精準。

下圖是同一組提示詞分別在 v5.2 和 v6.0 中生成的圖像,二者風格差別非常明顯。

A young man and a young woman are checking out for the buying in a shopping center, flat illustration style --ar 10:16
一名年輕男子和一名年輕女子在購物中心結賬,平面插畫風格 --ar 10:16

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

這是因為對于 v6 模型來說,“ flat illustration style”所指的內容太過寬泛了。如果想讓 v6 生成的風格貼近 v5.2 的樣式,需要加入一些更具體的風格關鍵詞,比如 UI、極簡、矢量等,此外也可以再優化一下提示詞順序,加入一些顏色、服裝等方面的細節描述,讓生成的圖像更貼合自己的需要。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

那么以上就是為大家總結的 Midjourney 新版本 v6 的相關內容,后續 v6 應該還會有一波大的更新,我也會及時帶大家了解最新的動態。喜歡本期推薦的話記得點贊收藏支持一波,也歡迎大家掃描下方二維碼,加入優設 AI 繪畫交流群,和大家一起學習 AI 知識。

Midjourney v6 終于更新了!一文詳解新版本 3 大要點

想系統學習 Midjourney 的小伙伴也可以了解我最新制作的 《 零基礎 AI 繪畫入門指南 》 ,我會帶大家了從零開始學習 2 款目前最熱門的 AI 繪畫工具 Midjourney 和 Stable Diffusion WebUI,并提供各種相關資源,解決大家在自學時教程不全面、找資源難、有疑問無處請教等情況,幫你快速入門~

推薦閱讀:

贊賞
收藏 85
點贊 79

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。