大家好我是花生~
很多讀者應該都有加入了我們優設的 AI 學習交流群,有空的時候我也會在里面看看大家的討論的內容、回答一些問題。前幾天正好幫一位小伙伴解決了一個 Midjourney 的出圖疑問,其實問題并不難,但中間因為一個關鍵詞的導致出圖效果怎么都不對,我也差點被繞進去了,還好最后找到了合適的解決辦法,沒有翻車。
事后自己回想了一下整個過程,覺得其中的一些思路還是很有啟發性的,于是決定把它整理出來分享給大家,看完之后你肯定也會有新的收獲~
相關推薦:
起因是有一個小伙伴問我,為什么在生成 “一個女生叼著玫瑰” 的圖像時,出來的圖都是一只手拿著花放在嘴邊,生成了好多次結果都沒有改變。
于是我讓他把提示詞和生成的圖發給我看看。提示詞寫的是 “A famous Peking opera singer, with a rose in her mouth, gazing back into the distance, surrounded by flowers” 。我的第一感覺就是動詞沒寫好,介詞 in 不足以表達出 “叼” 這個動作,于是讓他把動詞描述的準確一點。
他也很快給了反饋 —— 加上動詞后圖像并沒有什么改善,依舊是手拿著花。這次提示詞寫的是 “A famous Peking Opera singer, holding a rose, gazing back into the distance, surrounded by flowers” ,多了一個 “holding” 的動詞,但是關鍵詞 mouth 丟失了。
于是我說先把 mouth 加上試試,然后動詞可以不用 holding,因為這個詞有 “手拿” 的意思,可能會對畫面造成干擾,結果被告知 “叼” 這個詞語用軟件翻出來的就是 holding, 而且加了 mouth 之后圖像依舊沒有改善。當時我眉頭一皺,發現事情好像沒那么簡單,于是飛速打開 Midjourney, 想看看問題到底出在哪里。
我先是刪除了動詞 holding,改用了 carrying /keeping 等詞語,畫面依舊沒有改變;于是又加上了 --no hands, fingers 參數,調整了關鍵詞的順序,甚至還用上了許久未用的 :: 權重參數 ,結果都行不通:要么就是原封不動的手和花一起出現,要么就是一起消失,根本無法呈現出 “用嘴叼著” 這個動作。
當時我的腦子里想到過很多可能性:或許是女性叼花的動作不常見?于是將主角換成男性,結果沒有變化;又想到也許是 Midjourney 的模型無法理解 ”將花叼在嘴里“這個動作?于是又用了最新的 Flux.1 模型來生成圖像,但依舊行不通。
到這一步,我大概猜到了問題出在哪里——應該是某幾個詞語間存在的組合慣性,導致模型無法生成正確內容。生成式 AI 模型從本質上說都是概率預測模型,它們并不能像人一樣理解物理世界的運行規律,而是通過訓練去推測信息的組合概率,然后將概率最高的結果返回給我們。
比如你讓 Midjourney 生成一張 “一匹馬騎著宇航員” 的圖像,它 100% 會生成一張 “宇航員騎著一匹馬” 的圖像,這是因為當 “人” 、“騎”、 “馬” 三個元素組合在一起時,很明顯是 "人騎著馬" 的概率更高,而不是 “馬騎著人” (不過最新的 flux 等模型已經有改善了這個問題了)。
類似地,在 "A girl holding a rose with her mouth" 這句提示語中, “女孩” 、 “玫瑰” 、 “嘴” 組合在一起時,模型訓練的結果是 “女孩手拿著一只玫瑰靠近嘴邊” 的概率更高,而非 “女孩用嘴叼著一朵玫瑰”。為了驗證的自己的猜想,我測試了不同的物品對人物動作的影響。
在提示詞整體不變的情況下,我把 “花" 分別換成了刀、筆、暗器、草、樹枝等對象,發現當生成刀、筆、暗器這些本身就是用手使用的物品時,即使加上了 --no hands, fingers,畫面中手出現的概率依舊很高;而如果是生成紙片、草、樹枝時,手基本不會出現,"用嘴叼住"這個動作也能成功生成。
確認以上信息后,我就將圖像的生成步驟拆分為 2 步:先生成綠色的樹枝,然后再通過局部重繪的方式加上花朵。在多次嘗試后,最終成功生成了 “一個女孩嘴里叼著一朵玫瑰” 的圖像。
這個過程中我還發現,使用 Midjournety 官網的新局部重繪功能時,只描寫需要提添加的物體效果并不好,必須完整地描述整體畫面內容,才能得到理想的效果。
那么最后這種方式就是最好的解決方法了嗎?當然不是啦。
其實在意識到是元素組合慣性導致 "叼花" 這個動作無法正確呈現時,我就是嘗試過另一種方法:先生成人像,然后通過局部重繪的方式把玫瑰花加上去,結果 “叼著” 這個動作依舊無法實現,而且玫瑰的生成效果也很差。
所以最后還是用最傳統的方式解決了問題:先生成人物圖像,然后生成一只同風格的玫瑰花,再放到 Ps 里合成在一起。這種方式可比前面的不斷抽卡穩定高效多了,而且效果也更精致。我把兩張叼花的圖像一起發給那個提問的小伙伴時,他也覺得合成的那張效果更符合需求。
之所以還是把全部的過程都寫出來,是因為我覺得其中排查問題的思路還是很實用的。畢竟出現問題時只有先弄明白了問題的源頭在哪里,才能有針對性地找到解決方法。
另外目前 AI 繪畫工具主要起一個輔助的作用,我們不應該指望它能一次性解決所有問題,而要更理性地看待它。如果你發現無法用 AI 直接完成某個任務,就應該跳出預設的思路,嘗試其他的、或更原始的處理方法,問題解決起來可能會更輕松。
那么以上就是本期為大家分享的 Midjourney 提示詞優化思路,喜歡的話一定記得點贊評論支持一波,我會更有動力分享新的內容。
想更全面深入地學習 Midjourney 并做到靈活應用的話,也可以了解我最新制作的《零基礎 AI 繪畫入門完全指南》,我會從文本提示、圖像提示、參數、命令等方面細致講解 Midjourney 的操作方法,并結合實際案例分享超多干貨和冷門小技巧,幫你打下堅實的基礎,能有效利用 Midjourney 提升工作效率,完成商業出圖需求。
也歡迎大家關注「優設 AI 自學網」 和「優設微信視頻號」,每天都會分享最新的 AIGC 資訊和神器,讓你輕松掌握 AI 發展動態。也歡迎大家掃描下方的二維碼加入“優設 AI 知識交流群”,和我及其他設計師一起交流學習 AI 知識~
推薦閱讀:
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 25 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓