嗨大家好!假期愉快!
5 月 29 日,黑森林實驗室發(fā)布了 FLUX.1 Kontext,目標是通過一個統(tǒng)一的框架處理多種圖像任務,解決現(xiàn)有模型在多輪編輯中的一些關(guān)鍵痛點。
往期測評:
先說結(jié)論:可以解決一些,但解決得還不夠,但如果繼續(xù)優(yōu)化完善,未來還是可以對工作效率有幫助的。
官方介紹與我的個人感受:
- 統(tǒng)一的編輯與生成能力:FLUX.1 Kontext 使用單一模型即可完成多種任務。包括在保留背景的情況下修改物體(局部編輯),以及根據(jù)一張參考圖將角色置于全新場景中(上下文生成)。
- 出色的角色一致性:能在連續(xù)、多輪的編輯中保持人物或物體外觀的高度一致性。這對于創(chuàng)作故事板、系列圖片或任何需要角色連貫性的應用來說,可以說是重大利好了。根據(jù)評估數(shù)據(jù)以及我的實際測試,在人物、物體相似度保持方面,它的表現(xiàn)對比其他工具確實很不錯。
- 交互級的生成速度:FLUX.1 Kontext 的速度非常快,生成一張 1024x1024 分辨率的圖片僅需 3-5 秒。我這次使用的 Apple M4 Max 的 Mac Studio,測試每張圖出圖速度平均在 10 秒左右。
- 支持迭代式工作流:用戶可以通過連續(xù)的指令對一張圖片進行多次“微調(diào)”,而不會出現(xiàn)明顯的質(zhì)量下降或視覺漂移,從而實現(xiàn)更精細的創(chuàng)意控制。但迭代多了細節(jié)上還是有偽影,和圖像質(zhì)量和細節(jié)的損失。
總的來說,它現(xiàn)在可以直接修改主體和細節(jié),可以將圖片變成其他風格,可以將這種風格作為參考應用在生圖中,可以替換背景不改變主體,可以修改文本內(nèi)容但是保持文字風格一致(目前只支持英文),可以將前面我列舉的功能結(jié)合起來使用。并且它能保持很好的一致性和很強的風格遷移能力。
我們可以在這里免費體驗(外國網(wǎng)站),有贈送 200 積分: https://playground.bfl.ai/image/edit
或者在 ComfyUI 中使用: https://www.comfy.org/zh-cn/
具體 ComfyUI 中使用的步驟我留在后文講。
然后在其他的一些平臺也可以使用:KreaAI、Freepik、Lightricks、OpenArt 和 LeonardoAI 平臺都支持 FLUX.1 Kontext [max] 和 FLUX.1 Kontext [pro]了。
官方提示建議:將 [物體] 改變?yōu)?[新狀態(tài)],保持 [保留內(nèi)容] 不變
改變汽車的顏色,人物主體還還是不錯的,不過直接把虛化模糊的車都變清晰了怎么回事:
Character remain unchanged, the cars in the background remain unchanged, change the car‘s color to red.
角色保持不變,背景中的汽車保持不變,將汽車的顏色改為紅色。
這里我修改了人物手中的物體和文字部分,可以看到首先一致性保持得不錯,然后字體也是完全還原了原始字體,可惜目前不支持漢語。
Replace the toothbrush in the hand of the main character on the left with a microphone, making the character look like they are singing. Change the text content to "Singing, louder, more noise."
將左側(cè)主角手中的牙刷替換為麥克風,讓角色看起來像在唱歌。將文字內(nèi)容改為"唱歌,更大聲,更多噪音。"
這里我將一個卡通盲盒 IP 的角度讓它進行修改,注意看整體的細節(jié),無論是面部、珍珠數(shù)量細節(jié),海底背景,泡泡,甚至左上角的 AI 標志都很好地保持了原樣沒有改變。最后更換發(fā)色也非常和諧,除了發(fā)色其他地方基本沒有改變。
1.原圖
2.Keep the background unchanged, the character is sideways facing the audience.保持背景不變,角色側(cè)向觀眾
3.Maintain the background as is; the character is facing away from the audience.
保持背景不變;角色背對觀眾。
4.Maintain the background as is;The mermaid's hair changes to red.
保持背景不變;美人魚的頭發(fā)變成紅色。
一致性保持得好可以做的就比較多了,比如幫你去掉不喜歡的同事:
Maintain all other characters and scenes unchanged, remove the man in the center, and replace him with a bonsai.保留所有其他角色和場景不變,移除中間的男人,將其替換為一盆盆栽。
如果你不喜歡人,可以幫你全都去掉(假期游客照有救了),再替換個熱情似火的背景。
Remove all passerby from the background, change the background to a volcanic crater.
從背景中移除所有路人,將背景更改為火山口。
官方提示建議:轉(zhuǎn)換為 [特定風格],同時保持 [構(gòu)圖/角色/其他] 不變
首先試一下將一張圖片遷移為其他風格。在這方面我個人認為細節(jié)上還是稍稍不如 4o 的,但是也還不錯。
Transform the style into a watercolor style, cute, keeping the characters and background unchanged.將風格轉(zhuǎn)換為水彩風格,可愛,保持角色和背景不變。
Change the style to Japanese Ghibli style, keeping the characters and environment unchanged.將風格改為日本吉卜力風格,保持角色和環(huán)境不變。
Change the style to cartoon 3D clay texture style, keeping the characters and environment unchanged.將風格改為卡通 3D 粘土質(zhì)感風格,保持角色和環(huán)境不變。
Convert the style to a 16-bit mosaic pixel style, keeping the main character and background unchanged.將風格轉(zhuǎn)換為 16 位馬賽克像素風格,保持主角和背景不變。
或者我給一張指定風格的照片,Kontext 參考風格,遷移風格,生成其他場景。一致性細節(jié)真的很好,比如我第一張圖肩膀上有奇怪的肩帶,這個人物身上的帶子在延展其他圖片的時候依然存在哈哈哈:
- 原圖
- 保持原始畫面風格,清晨的江南小巷,剛被雨水沖刷過。一個紙鳶纏繞在電線桿上,屋檐下掛著一個竹籃,巷尾的茶館剛剛開門,溫暖的燈光從里面灑出。
- 保持原始畫面風格,一位穿著深綠色旗袍的女子撐著傘走進雨中的小巷,臉上帶著淡淡的思索表情。她穿過灰磚和瓦屋頂,雨滴輕輕地拍打著她的傘,路旁的燈籠隨風輕輕搖曳。
- 保持原始畫面風格,鏡頭拉近到屋檐的一角,那里有一只小鳥,給小鳥一個特寫鏡頭。
- 保持原始畫面風格,她經(jīng)過一家裁縫店,櫥窗里掛著未完成的布料。一只貓在門旁的踏板上打盹,而店內(nèi),一位老人專注地縫制著,每一針都一絲不茍。
- 保持原始畫面風格,鏡頭拉近,給左下角睡著的貓一個特寫鏡頭。「鏡頭拉近這個效果很好用,后續(xù)可以在首尾幀或者連續(xù)鏡頭中使用。」
- 保持原始畫面風格,她在老街盡頭的一家郵局前停下,從包里取出一封舊信。背景是潮濕的格子窗和一個斑駁的門牌;信封的邊緣有些破損。
- 保持原始畫面不變,環(huán)境變成夜晚。
或者為角色圖延展相同風格的環(huán)境圖(下方上面這張是 Midjourney y 生成的,我個人感覺美學和質(zhì)感上 Kontext 比起來還是稍微有一些差距的):
Using this style, depict a glowing meadow on the ocean floor, filled with soft sea anemones and dreamlike bubbles rising through spirals of light. The ground is dotted with ancient stone rings and smooth white pebbles that pulse faintly with color. In the background, and a school of silver fish forms a perfect spiral as it swims by, leaving behind a trail of glittering particles.
使用這種風格,描繪海底發(fā)光的草地,充滿柔軟的海葵和夢幻般的氣泡,通過螺旋光線上升。地面點綴著古老的石環(huán)和光滑的白色鵝卵石,微弱地閃爍著色彩。在背景中,一群銀魚游過時形成完美的螺旋,留下閃閃發(fā)光的粒子軌跡。
官方提示建議:將背景改為 [新背景],保持主題在完全相同的位置和姿態(tài)
原本只想做背景替換,但是感覺有點無趣,就把人物一致性一起放里面測試了,每次可以改動,但是不能改動太多,調(diào)整次數(shù)也不能太多,到后面面部整體細節(jié)會有影響。
- 原圖
- (參考圖 1)Keep the face completely unchanged. Position the subject for a passport-style headshot. Use a plain light grey or white background, even frontal lighting, and neutral facial expression. Hair neatly arranged, no shadows. Center the face in the frame.
- (參考圖 1)Keep the facial features and expression unchanged. The person is not looking at the camera, a full profile shot.
- (參考圖 1)1??Keep the facial features and expression unchanged. Place the subject beside a colorful supermarket shelf, under bright fluorescent lighting. Use a wide-angle lens with a slight distortion. Capture a side profile with sharp detail, maintaining a lifestyle and candid feel. 2??The character setting and background remain unchanged, The person is facing the camera and laughing.(這里跑了2次,有一個過渡,人物-人物在超市-人物在超市,帶笑表情。一次跑出來的效果可能不理想,遇到相同要求可以參考這個)
- (參考圖 4)The character setting and background remain unchanged, The person Holding a bottle of cola up to the camera.
- (參考圖 3)Preserve facial structure. The subject Wearing a grey T-shirt and jeans.sits indoors near a large café window. Shoot from outside through the glass, capturing the reflection layered over the face. Use a soft-focus depth and warm interior lighting. Composition is intimate and poetic.
- (參考圖 6)Preserve facial structure.The character is playing the guitar, her gaze is lowered towards the guitar, leaving the back of her head for the audience, and the camera zooms in.
- (參考圖 6)Preserve facial structure. at night,The girl is holding a birthday cake in her hand, looking towards the camera, with an extreme close-up, focusing on her facial expression, which is happy and relaxed.
- (參考圖 3)Keep the face completely consistent. The character has short hair, using standard passport photo front-facing half-body composition, with a pure gray or pure white background, even lighting without shadows, natural and upright facial expression, neat hair, and centered facial alignment.
(這段內(nèi)容太多了就不翻譯了,大家需要可以自行翻譯)
- 原圖
- (參考圖 1)The characters maintain the same facial features and hairstyle, with a sweet smile indicative of being in love.角色保持相同的面部特征和發(fā)型,帶著陷入戀愛中的甜蜜微笑。(這里直接給我加了個女孩哈哈哈)
- (參考圖 1)The background changes to a Tokyo night scene, and the character is wearing a white T-shirt.背景改為東京夜景,角色穿著白色 T 恤。
- (參考圖 5)The character has a clean face and laughs out loud at the camera.角色面部干凈,對著鏡頭大笑。
- (參考圖 6)Maintain the background unchanged, the character turns around, leaving a back view.保持背景不變,角色轉(zhuǎn)身,留下背影。
- (參考圖 6)Maintain the background unchanged, the character rides on a motorcycle, wearing a pink motorcycle helmet with a cute Carrot sticker on it.保持背景不變,角色騎著摩托車,戴著一頂帶有可愛胡蘿卜貼紙的粉色摩托車頭盔。
再比如大家比較熟悉的老演員毛毛小狗的快樂一天,這次色調(diào)和材質(zhì)都對上了,也沒有發(fā)黃(沒錯,我在陰陽 4o):
- 原圖
- (參考圖 1)Keep the background unchanged, the character is facing away from the camera.保持背景不變,角色背對鏡頭。
- (參考圖 1)Maintain the setting of the main character Shiba Inu.The Shiba Inu raised its right paw to put on sunglasses for itself.保持主角柴犬的設(shè)定。柴犬抬起右爪為自己戴上墨鏡。
- (參考圖 3)Maintain the setting of the main character Shiba Inu.The Shiba Inu is sitting in the car driving.保持主角柴犬的設(shè)定。柴犬坐在車里開車。
- (參考圖 1)Keep the character and material settings the same, but replace the background with a cyberpunk-themed bar. The character raises a mint-colored cocktail in their hand.保持角色和材質(zhì)設(shè)定不變,但將背景替換為賽博朋克主題的酒吧。角色手中舉著一杯薄荷色的雞尾酒。
- (參考圖 5)Keep the character and material settings the same, The Shiba Inu was drinking, A huge red panda was added on the right, the red panda and the Shiba Inu have the same character style, and the red panda is drinking orange juice.保持角色和材質(zhì)設(shè)定不變,柴犬在喝酒,右側(cè)添加一只巨大的小熊貓,小熊貓和柴犬具有相同的角色風格,小熊貓在喝橙汁。
官方提示建議:將 '[原文]' 替換為 '[新文]',保持相同的字體樣式
保持相同字體樣式它是做得很好的,但是考慮它只能延伸英語的,這里就不做過多展開了,大家可以看看效果,字體樣式確實保持得很好。
Replace "fief" with "Irene." Keep the same font style.
將 "fief" 替換為"Irene."保持相同的字體樣式
Keep the font style unchanged, replace "Redefine Your Weekend" with "Procrastinate Professionally";
Replace "Break away from toxic work culture and embrace two days of conscious rest and recharge." with "Call it 'self-directed learning' while rewatching cat videos and Googling 'how can focus.'"
保持字體樣式不變,將“Redefine Your Weekend(重新定義你的周末)”替換為“Procrastinate Professionally(專業(yè)拖延)”; 將“Break away from toxic work culture and embrace two days of conscious rest and recharge.(擺脫有害的工作文化,擁抱兩天有意識的休息與充電。)”替換為“Call it 'self-directed learning' while rewatching cat videos and Googling 'how can focus.'(把反復看貓咪視頻和搜索“如何集中注意力”稱為“自我主導學習”。)”。
1. 產(chǎn)品換背景
然后還想補充一點例如產(chǎn)品和 IP 方面的。比如,假設(shè)我有個可樂素材(僅供學習交流,內(nèi)容與品牌無關(guān))可以做一些背景和文字的改變。但是目前似乎做不了風格過于明顯和突出的,如果這樣做就會被頻繁報錯,說改動幅度太大:
- 原圖
- A vintage American diner scene from the 1950s, with checkered black and white floor tiles, shiny red leather booths, and a glowing neon sign reading "Cold Drinks" in the background. Sunlight streams in through large glass windows, creating reflections on the glass Coca-Cola bottle standing on a glossy chrome counter. The unopened bottle is covered with condensation droplets, and next to it lies a bottle opener and a red-and-white napkin. Warm ambient lighting adds a nostalgic and inviting atmosphere. 1950 年代的美式復古餐廳場景,黑白格子地板磚,閃亮的紅色皮革卡座,背景中有一個發(fā)光的霓虹燈牌寫著"Cold Drinks"。陽光透過大玻璃窗灑進來,在放置于光亮鍍鉻柜臺上的玻璃可口可樂瓶上形成反射。這瓶未開封的瓶子表面布滿凝結(jié)的水珠,旁邊放著一個開瓶器和一張紅白相間的餐巾紙。溫暖的環(huán)境光線營造出懷舊而誘人的氛圍。
- Keep the drink bottle unchanged. The bottle stands on cracked earth, while floating islands drift slowly in the sky above. 保持飲料瓶不變。瓶子立在龜裂的土地上,而浮空島嶼在上方的天空中緩緩漂移。
- The subject remains unchanged, the text style remains unchanged, and the text is modified to "Cool Irene". 主體保持不變,文字樣式保持不變,文字修改為"Cool Irene".
2. 局部細節(jié)
或者當我有一張人物著裝照片,可以直接讓 Kontext 提取出服裝為平鋪效果,也可以在平鋪效果的基礎(chǔ)上再將鏡頭拉更近體現(xiàn)織物細節(jié)。
- 原圖
- (參考圖 1)no people, extract only the coat over a white background, product photography style.無人物,僅提取外套置于白色背景上,產(chǎn)品攝影風格
- (參考圖 2)show me an extreme closeup of the fabric 給我展示布料的極近特寫
3. 三視圖
IP 方面,可以讓它直接輸出三視圖(這里的三視圖是一次性成功的):
- 原圖
- (參考圖 1)The character remains the same; girl stands Standing on the floor.against a backdrop of pink plaid, with a display of tableware behind him.角色保持不變;女孩站在地板上,背景是粉色格子布,身后展示著餐具。這張圖有個過渡圖,去掉了底座,也損失了一些細節(jié),比如圍裙上的草莓紋理細看是有點不一樣的。
- Output front view, side view, rear view. 輸出正視圖、側(cè)視圖、后視圖。這里輸出圖的比例為設(shè)置為了 4:1,設(shè)置 3:1 也可以,但是也不會是非常規(guī)矩的三個正方形,比較隨機。
4. 多圖參考
目前比較難直接多圖參考,但是有個妙計,先把需要的多圖拼起來。謝謝@AI 煉丹師忠忠教我的技巧哈哈。
比如下面圖一是原圖(兩張圖的拼圖),圖二是輸出圖。但是這招目前出現(xiàn)問題的幾率比較大。
Keep the scene from the above image unchanged and insert the character from the below image into the scene of the above image.
保持上圖的場景不變,讓下圖的人物出現(xiàn)在上圖的場景中。
網(wǎng)址(有 200 積分免費額度可體驗): https://playground.bfl.ai/image/edit
生成功能:這個和一般工具的生成功能基本是一樣的。這里不展開講了。
編輯功能:
Batch Size 批處理大小
- 值:1-4 張
- 數(shù)值越大,一次輸出的圖越多。節(jié)約積分建議可以為 1-2。
Safety Tolerance 安全容錯
- 值:0-6
- 含義:模型的安全策略容忍度,通常控制對不當內(nèi)容的敏感程度,數(shù)值越大生成內(nèi)容范圍越廣,數(shù)值更小可防止生成 NSFW 或冒犯性圖像。
Prompt Upsampling 提示上采樣
- 含義:指增強關(guān)鍵詞影響力或提升對 prompt 的理解分辨率。開啟后可能會使提示詞中的主元素更突出,但也可能導致圖像構(gòu)圖過度集中。
Output Format 輸出格式
- 輸出格式:PNG/JPEG
- Seed 種子含義:控制圖像生成的“隨機性種子”。按下 "Random" 每次都會生成不同圖。
點擊小箭頭圖標發(fā)送,稍等一會兒就可以看到輸出的圖片:
ImageImageImage可以看到皮膚細節(jié)和整體色調(diào)稍微有所改變(可能是為了適應環(huán)境),但是人物整體和面部細節(jié)保持得非常好,和環(huán)境融合也很自然。
填充功能:
選擇要填充的位置,然后在下方描述填充位置的元素:
擴圖功能:
比如上傳一張圖,調(diào)整這張圖的大小,然后在下方可以加入對擴展部分的描述。
使用需要購買 API,支持微信支付和支付寶支付。在設(shè)置中可以找到積分余額和充值渠道。
然后簡單看看工作流:
aspect_ratio(寬高比)
- 圖像輸出的長寬比,3:2 通常表示例如 768×512 這樣的尺寸(寬大于高)。如果為了對比效果更明顯,可以設(shè)置和原圖比例一致。
- guidance(提示引導系數(shù))
- 數(shù)值默認3.0,這里可以維持3。
- 含義:提示詞引導強度,也叫 CFG(Classifier-Free Guidance)值。
- 越高表示模型越依賴提示詞(更“聽話”),但過高可能失真或不自然。
- 常見范圍:1.5–7.5,一般?2–4?較為平衡。
- steps(采樣步數(shù))
- 數(shù)值默認50
- 含義:采樣步數(shù),指擴散模型反向去噪的次數(shù)。步數(shù)越多,圖像質(zhì)量可能更好,但也更耗時;20–50?屬于正常范圍。
- seed(隨機種子)
- 生成圖像時所用的隨機數(shù)種子。
- 可用于復現(xiàn)圖像或用于做對比實驗。
- control_after_generate(生成后控制)
- 包含了控制/增加/減少/隨機選項。主要是控制在每次圖像生成完成后,是否自動改變關(guān)聯(lián)組件的值,常見用途是自動更換種子(seed),以便下一次生成出不同的圖像。
- 默認選項:randomize,正常使用的時候不用修改。
- 不同模塊會有不同處理邏輯,具體含義需看你的workflow使用了哪個control模塊(如 ControlNet、T2I-Adapter)。
- prompt_upsampling(提示詞放大)
- 默認選項:false。
- 關(guān)閉:完全按你輸入的提示詞執(zhí)行,結(jié)果可復現(xiàn),更可控。
- 打開:自動增強提示詞語義,可能加入創(chuàng)意變化,結(jié)果不可復現(xiàn)。
上面的參數(shù)最簡單易懂的方式就是打開以后只調(diào)整圖片比例,其他全部保持不變。
另外,jpeg 格式的圖片可能會無法預覽(我是 Mac 版本,不確定其他版本會不會也無法預覽),比如即夢的下載圖片上傳進去就不可以預覽,但是可以工作。png 和 jpg 可以預覽。
以及,F(xiàn)reepik 我之前體驗了下,只找到生圖的區(qū)域,沒找到編輯的,如果有朋友知道的可以評論區(qū)留言我們一起交流下。其他平臺我目前還沒有體驗,后續(xù)如果有效果更好工作流更科學的平臺我再推薦給大家。
關(guān)于 FLUX.1 Kontext 的 pro 與 max 版本怎么選:
FLUX.1 Kontext [pro]:速度更快,質(zhì)量細節(jié)略遜于 max 版,單張 0.04 美金(Comfy UI 客戶端價格),性價比更高。
FLUX.1 Kontext [max]:耗時更長,圖片質(zhì)量更好,圖像保真度和細節(jié)表現(xiàn)力更優(yōu)秀,單張 0.08 美金(Comfy UI 客戶端價格)。
此外他們還有開發(fā)了一個開放權(quán)重版本,F(xiàn)LUX.1 Kontext [dev],是一個輕量級的 12B 擴散 Transformer,適合定制且與之前的 FLUX.1 [dev]推理代碼兼容。這個是以私人測試版的形式開放 FLUX.1 Kontext [dev],用于研究和安全測試。如果感興趣,可以聯(lián)系 kontext-dev@blackforestlabs.ai
總的來說,目前存在的問題與不足如下,在黑森林實驗室的論文中也提到了目前模型的局限性:
- 多輪編輯后質(zhì)量退化。在進行過多的、連續(xù)的多輪編輯后,模型生成的圖像可能會出現(xiàn)視覺瑕疵或偽影,導致圖像質(zhì)量下降。
- 指令遵循的準確性。少數(shù)情況下,模型可能無法完全準確地遵循用戶的指令,有時會忽略或誤解提示中的特定要求 。
- 世界知識有限。模型的“世界知識”仍然有限,這可能會影響它生成特定上下文或事實性內(nèi)容時的準確性。
- 蒸餾過程引入的瑕疵:模型訓練中采用的蒸餾技術(shù)(distillation process)本身也可能引入一些視覺上的瑕疵,從而影響輸出圖像的最終保真度。
我個人實測后,目前發(fā)現(xiàn)存在的問題不足有:目前大部分可使用它的平臺無法參考多圖像,無法使用知名 IP(這個也不算問題,但是拿知名 IP 玩梗是不太行了哈哈),無法改變過多元素,動作過大會報錯,表情情緒不夠強烈,實際上在修改后還是有微小細節(jié)的調(diào)整(比如細微角度或者鏡頭遠近等)。
建議:如果要你的目的是既要改變場景又要改變角色動作,可以先跑一次換一個部分,然后再換另一部分,比如先換場景再換動作。另外,提示詞不要太長,修改的地方多了就容易報錯。如果原圖比較規(guī)規(guī)矩矩,就可能比較難做出視覺沖擊比較大的修改。
下面是官方給出的提示詞輸出建議(這里翻譯成中文版了):
### 1. 基本修改 -?簡潔直接:`"將汽車顏色改為紅色"` -?保持風格:`"改為白天場景,同時保持畫面的同一風格"` ### 2. 風格遷移 **原則:** -?明確命名風格:`"轉(zhuǎn)換為包豪斯藝術(shù)風格"` -?描述特征:`"轉(zhuǎn)換為有可見筆觸的油畫,厚重的油漆質(zhì)感"` -?保持構(gòu)圖:`"改為包豪斯風格,同時保持原始構(gòu)圖不變"` ### 3. 角色一致性 **框架:** -?具體描述:`"短發(fā)黑發(fā)的女人"`?而不是 "她" -?保持特征:`"同時保持相同的面部特征、發(fā)型和表情"` -?步驟修改:先改變背景,然后是動作 ### 4. 文本編輯 -?使用引號:`"將 '快樂' 替換為 'BFL'"` -?保持格式:`"替換文本,同時保持相同的字體樣式"` ## 常見問題解決方案 ### 角色變化過大 ? 錯誤:`"將人物變成維京人"` ? 正確:`"改變服裝為維京戰(zhàn)士,同時保持面部特征不變"` ### 構(gòu)圖位置變化 ? 錯誤:`"把他放在海灘上"` ? 正確:`"改變背景為海灘,同時保持人物在完全相同的位置、比例和姿態(tài)"` ### 風格應用不準確 ? 錯誤:`"使其成為素描"` ? 正確:`"轉(zhuǎn)換為鉛筆素描,具有自然的石墨線條、交叉陰影和可見的紙張質(zhì)感"` ## 核心原則 1.**具體明確**?- 使用精確的描述,避免模糊的術(shù)語 2.**逐步編輯**?- 將復雜的修改分解成多個簡單的步驟 3.**明確保留**?- 說明應保持不變的內(nèi)容 4.**動詞選擇**?- 使用 "改變"、"替換" 而不是 "轉(zhuǎn)換" ## 最佳實踐模板 **物體修改:** `"將 [物體] 改變?yōu)?[新狀態(tài)],保持 [保留內(nèi)容] 不變"` **風格遷移:** `"轉(zhuǎn)換為 [特定風格],同時保持 [構(gòu)圖/角色/其他] 不變"` **背景替換:** `"將背景改為 [新背景],保持主題在完全相同的位置和姿態(tài)"` **文本編輯:** `"將 '[原文]' 替換為 '[新文]',保持相同的字體樣式"` > **記住:** 越具體越好。Kontext 在理解詳細指令和保持一致性方面表現(xiàn)卓越。
前面特別多記不住,那就記得三點:
- 提示詞的核心:輸入哪些不要變,哪些要變。
- 一次變不了太多,每次改變一部分。
- 提示詞使用英語。(我嘗試的是 ComfyUI 的客戶端,大家如果有使用中文有同樣效果的平臺可以在下方留言告訴我,感謝!)
最后附上論文原地址,有感興趣的朋友可以看一看:https://cdn.sanity.io/files/gsvmb6gz/production/880b072208997108f87e5d2729d8a8be481310b5.pdf
最后還有一個彩蛋哈哈哈,是使用 Kontext 制作的圖片,vidu 制作的視頻,阿真版·瞬息全宇宙:
好了,今天的分享就到這里啦,希望這期的內(nèi)容對大家有幫助~
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計師平臺,提供獎品贊助 聯(lián)系我們
標志設(shè)計標準教程
已累計誕生 729 位幸運星
發(fā)表評論 為下方 9 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓