根據前兩篇學習,如何創建人物連續性公式,或多或少都會聯想到 Midjourney 里面的 Seed 值,是否能運用到 Dall e3 里面,那么今天這篇文章更新來了!!
繼續感謝這位偉大的作者:@AshutoshShrivastava,地址鏈接請看前兩篇內容。
1. 如何使用種子值
如果您已經使用 DALL-E-3 工作,您應該知道以前種子號碼是無法更改的,固定在 5000。
然而今天發現我們實際上可以指定種子號碼。這意味著,通過相同的提示和種子,您可以在不同的實例中一致地生成完全相同的圖像。
首先,設置你的自定義指令 為:
" DMP " means: do not in any circumstance modify my prompt, please create image using this prompt: Also, use wide aspect ratio by default and when you generate an image, always provide the seed number details for that image after it's rendered.
" DMP " 意味著:在任何情況下都不要修改我的提示,使用這個提示創建圖像。
另外,請默認使用寬屏幕縱橫比,當生成一張圖片時,始終提供生成該圖片的種子數細節。
注意:在 DALL-E-3 中,即使你提供了一個種子,縱橫比會影響最終結果。因此,在指定種子時,請確保使用相同的縱橫比。
這個自定義指令的作用是令 ChatGPT 永遠不修改你的提示,并根據你提供的內容生成。默認情況下,它使用寬屏幕縱橫比,并返回種子數。但有時候可能會出現錯誤。因此在工作時,你可以詢問:“Do you know what DMP means? -- 你知道 'DMP' 是什么意思嗎?” 一旦它回答,你可以相應地指示它繼續工作,確保它正常運行。
例如:如果我請求 "DMP:dog",它將使用完全相同的提示并為我提供一張圖片以及種子號:1840089640。
現在,打開一個不同的 DALL-E 3 聊天實例,并輸入如下命令:"DMP Prompt:dog, Seed: 1840089640"。它將提供完全相同的結果。
現在,更改種子值并觀察結果。我的更新命令是"DMP Prompt:dog, Seed: 1844489640",我已經更改了種子號碼。你會注意到不同的結果。
那么,我進入了另一個不同的聊天實例,并輸入了相同的命令,沒有指定種子值。它生成了不同的圖像并返回了一個新的種子值。您可以使用此種子和提示再次生成相同的圖像。
1. 能否實現一致性
隨著 DALL-E 3 引入種子(Seed 值),一個重要問題浮現出來:我們能實現一致性嗎?如果可以,到什么程度?如果不行,為什么呢?讓我們來深入探討。
我花了將近一整天的時間來進行 DALL-E 3 的實驗,現在有了一個結論。但在我們深入研究之前,讓我們先設定一下背景,然后通過示例來探討。
假設:相同的種子 + 相同的提示 = 相同的輸出 / 相同的種子 + 不同的提示 = 不同的輸出 / 不同的種子 + 相同的提示 = 不同的輸出。(Same seed + same prompt = identical output./Same seed + different prompt = different output./Different seed + same prompt = different output.)
我的觀點:當使用一致的種子并在提示中引入微小的變化時,生成的圖像表現出一定程度的一致性。尤其是在面部特征等方面,如果對提示進行的更改涉及到其他元素(如背景或服裝),面部可能會在很大程度上保留其原始形態。此外,如果在提示中加入微妙的情感元素,整體上也可能保持一致性。
然而,面部和特征一致性的保留程度取決于:
變化的性質:直接影響面部或特征描述的提示更改(例如,改變頭發顏色、添加眼鏡)顯然會對輸出產生更明顯的影響。
模型的解釋:有時,措辭上的微小變化可能被模型不同解釋,導致意外的變化。
提示的語義:如果提示的變化引入了新的上下文或情景,可能會影響圖像的其他方面,包括面部或其特征。
第一種情況
假設我們直接將種子值并入提示中,那么會出現什么結果?在這種情況下,我們能夠保持一致性嗎?讓我們來看看。
這是我的提示:
photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, wearing a green t-shirt, ,Seed:XXXXXXXXX
30 歲的美國女子霍普的照片,頭發卷曲,穿著綠色 T 恤,<情感>,種子:XXXXXXXXX
所使用的情感詞包括:微笑、開心、傷心和生氣(smiling, happy, sad and Angry )
當使用相同的種子時,一致性 是顯而易見的。我對多個角色進行了實驗,結果是一致的,尤其是當提示的變化較為微妙時,正如我前面所討論的那樣。
第二種情況
如果我們不指定種子,而是允許 DALL-E 3 自行選擇,會發生什么?我們是否仍然能夠實現一致性?讓我們探討這種可能性。
這是我的提示:
photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, wearing a green t-shirt,
30 歲的美國女子霍普的照片,頭發卷曲,穿著綠色 T 恤,<情感>
所使用的情感詞包括:微笑、開心、傷心和生氣(smiling, happy, sad and Angry )
在 DALL-E 3 使用自己的隨機種子的情況下,我觀察到生成的圖像中 絕對沒有一致性。
第三種情況
假設我們在保持角色“Hope”和她的特征一致的情況下,對環境進行細微的更改。例如,“Hope 正在徒步旅行”與“Hope 正在堆雪人”。盡管活動和場景發生變化,角色的一致性是否仍然會保持?讓我們來評估一下。
使用相同種子的提示:(我們有一定的一致性,面部特征是明顯的)(左邊)
a. photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, wearing a white jacket and carrying a red backpack, hiking in the mountains , Seed:XXXXXXXXX
b. photorealistic portrait of a 30-year-old American woman named Hope with curly wavy hair, dressed in winter attire, in a snowy landscape making a snowman , Seed:XXXXXXXXX
a. 30 歲的美國女子 Hope 的照片,頭發卷曲,穿著白色夾克,背著紅色背包,在山區徒步旅行,種子:XXXXXXXXX
b. 30 歲的美國女子 Hope 的照片,頭發卷曲,穿著冬季裝備,在下雪的景色中堆雪人,種子:XXXXXXXXX
相同的上述提示,但沒有相同的種子:(沒有一致性,面部特征不同)(右邊)
第四種情況
如果我們對主題“Hope”進行根本性的改變,例如,我們用長直發來描述“Hope”,而不是她通常的形象,這種改變會如何影響整體形象,而“Hope”的本質是否仍然能夠被認出?讓我們來調查一下。
使用相同種子的提示:(沒有一致性)
a. photorealistic portrait of a 30-year-old American woman named Hope with long straight hair playing a violin, Seed:XXXXXXXXX
b. photorealistic portrait of a 30-year-old American woman named Hope with long straight hair , painting on a canvas, surrounded by art supplies, Seed:XXXXXXXXX
a. 30 歲的美國女子 Hope 的照片,長直發,拉小提琴,種子:XXXXXXXXX
b. 30 歲的美國女子 Hope 的照片,長直發,繪制畫布,周圍有美術用品,種子:XXXXXXXXX
相同的上述提示,但沒有相同的種子:(沒有一致性,面部特征不同)
原因:即使使用相同的種子,也 沒有一致性。這種不一致性歸因于前面提到的變化的性質。通過改變“Hope”的基本方面(她的頭發),這直接影響了對她面部的描述,即使使用相同的種子,我們也失去了對“Hope”的可識別特征。
即使沒有相同的種子,一致性也不存在。輸出每次都不同,強調了在實現一致結果方面主題核心細節的重要性。
結論:使用相同的種子不保證一致性。如果是這樣的話,那么使用相同的種子將始終生成具有相同面部特征和角色屬性的圖像,而不管環境或核心值的變化。然而,使用相同的種子可以通過保留主題的核心特征,并僅對周圍元素或環境進行細微的更改來實現一定程度的一致性。
1. 怎樣寫提示
有了 DALL-E 3 的新種子功能,您需要確切的提示和種子才能復制一張圖片。否則,每個提示都會產生不同的結果。
我們知道,DALL-E 3 之前將 5000 作為默認種子。為了用相同的提示獲得相同的 Hope 圖像,現在我必須使用種子。
讓 ChatGPT 準備好生成圖像。(您可以開始一個新的聊天實例;沒有必要繼續使用舊的實例)。
<---提示開始--->
Set Seed for all image as 5000 from now on.
We are going to work on camera angle and shot type and we still need to maintain consistency so we will follow this :
For activity-related images: (like hiking , reading book , walking etc)
[Base Prompt], [additional_details], [Camera Angle], [Shot Type] +identifier-1
For images focused solely on Hope:
[Base Prompt], [Camera Angle], [Shot Type] +identifier-1
Base Prompt is : llustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun
Important point: A certain level of consistency can be achieved using same seed by retaining the core characteristics of the subject and making only subtle alterations to the surrounding elements or environment.
As we want consistent character so when i ask for activity just add few words to describe the activity like for hiking add hiking in appropriate attire or playing in snow not more than 4-5 words under **additional_details**
We will Use combination of these whatever suits best for the scene:
Camera Angle: Eye-Level,Low Angle,High Angle,Bird's eye view
Shot Type: Wide Shot,Close-Up,Over-the-Shoulder Shot,Extreme Close-Up, Side-Profile
Identifier base value is 0000 and it must be incremented each image generation.
中文版:
從現在開始,為所有圖像設置種子為 5000。
我們將研究攝影機角度和拍攝類型,但我們仍然需要保持一致性,因此我們將按照以下方式進行:
對于與活動相關的圖像:(比如徒步旅行、讀書、散步等)
[基本提示],[額外細節],[攝影機角度],[拍攝類型] + 標識-1
僅關注 Hope 的圖像:
[基本提示],[攝影機角度],[拍攝類型] + 標識-1
基本提示是:插圖肖像,題為 30 歲的美國女人 Hope,她有卷曲的波浪發型盤在發髻上。
重要提示:通過保留主體的核心特征,并僅對周圍元素或環境進行微小的改動,可以實現一定程度的一致性,因此當我要求進行活動時,只需添加幾個詞來描述活動,比如徒步旅行適當的著裝或在雪地里玩,不超過 4-5 個詞在額外詳細信息下。
我們將使用這些的組合,以最適合場景的方式:
攝影機角度:平視、低角度、高角度、鳥瞰
拍攝類型:全景、特寫、肩上鏡頭、極特寫、側面鏡頭
標識符基值為 0000,必須逐個圖像生成遞增。
<--- 提示結束 --->
①讓我們首先專注于 Hope。在這個情節中,我們將從不同的角度集中在 Hope 的側臉上。
在這種情況下,我們使用這些組合實現了 90-95%的一致性。(圖像中的數字表示提示編號。)
原因很簡單,我們在固定的種子編號中進行了微小的更改。每張圖片中的攝影機角度和拍攝類型也非常清晰。
1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Low Angle, Extreme Close-Up -0019
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,低角度,極特寫 - 0019
2.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, High Angle, Side-Profile -0020
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,高角度,側面鏡頭 - 0020
3.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Eye-Level, Side-Profile -0023
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,平視,側面鏡頭 - 0023
4.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, High Angle, Wide Shot -0026
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,高角度,全景 - 0026
在這個示例中,一致性大幅下降(圖像中的數字表示提示編號)。
即使使用相同的種子,這種變化的原因在我關于種子和一致性的帖子中有解釋。
1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Eye-Level, Close-Up -0017
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,平視,特寫 - 0017
2.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, Eye-Level, Wide Shot -0016
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,平視,全景 - 0016
3.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, High Angle, Close-Up -0021
美國 30 歲的女性 Hope 以她盤在發髻上的卷曲波浪發型為特色的插圖肖像,高角度,特寫 - 0021
②在這個示例中,我們將注意力轉向一幅活動場景的圖像。在這里,我們將描繪 Hope 參與活動的場景。對于這個示例,我選擇了一個她在咖啡館喝咖啡的場景。
在這種情況下,我們使用這些組合實現了 85-95%的一致性。(圖像中的數字表示提示編號。)
1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Eye-Level, Close-Up -0029
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,平視,特寫 - 0029
2.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, High Angle, Close-Up -0035
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,高角度,特寫 - 0035
3.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Low Angle, Close-Up -0031
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,低角度,特寫 - 0031
4. Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Bird's eye view, Close-Up -0038
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,鳥瞰,特寫 - 0038
在這個示例中,一致性下降很多(圖像中的數字表示提示編號)。
1.Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Low Angle, Over-the-Shoulder Shot -0034
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,低角度,肩部特寫 - 0034
2. Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Eye-Level, Over-the-Shoulder Shot -0033
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,平視,肩部特寫 - 0033
3. Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, drinking coffee in a cafe, Bird's eye view, Wide Shot -0037
插圖肖像,描繪了一位名叫 Hope 的 30 歲美國女性,她盤在發髻上的卷曲波浪發型為特色,穿著綠色 T 恤,在咖啡館喝咖啡,鳥瞰,全景特寫 - 0037
結論:使用相同的種子不保證一致性。通過使用相同的種子,可以在保留主題的核心特征并僅對周圍元素或環境進行細微更改的情況下實現一定程度的一致性。
人物連續性 · 種子就到這里。
歡迎關注作者微信公眾號:「RaDesign」
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 1 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓