上周我介紹了 gemini 生圖模型,我覺(jué)得已經(jīng)算是實(shí)用性很強(qiáng)了,但緊接著 Open AI 就卷起來(lái)了,也更新了一波圖像生成模型,然后迅速在全網(wǎng)刷屏。那它的效果到底好不好用呢?是不是被吹的很厲害?我很好奇啊,所以周末趕緊深度實(shí)測(cè)了一波,先說(shuō)結(jié)論:生成的圖確實(shí)比 Gemini 的更好,但也并不完美。
我用 GPT-4o 深度測(cè)評(píng)了 2 天,當(dāng)它真的可以指哪打哪后,我實(shí)在是不知道怎么形容。這篇文章我先跟大家總結(jié) 10 個(gè)最好用的使用示例,向你證明它確實(shí)是太好用了!
先說(shuō)明一下,有些人可能會(huì)發(fā)現(xiàn)不充會(huì)員也能用 GTP-4o,但出來(lái)的圖效果完全不行。這是因?yàn)槊赓M(fèi)用戶是用不了新的圖像生成模型的,每天送的那 5 次用的其實(shí)是 Dall-E 模型,不是真正的新繪圖模型。
充值后,選擇更多中的“創(chuàng)建圖片”用的才是全新的 GTP-4o 畫(huà)圖模型。
所以,我周末花費(fèi)巨資,先是買(mǎi)了一張?zhí)摂M信用卡,然后又再充值了一個(gè) plus 會(huì)員,很順利的就用上了。注意咱們只需要花$20 買(mǎi) plus 會(huì)員就夠了,不用去買(mǎi)那個(gè)$200 每個(gè)月的,太浪費(fèi)了。 從我使用的情況來(lái)看,plus 會(huì)員就能一直生圖,我用了 2 天,沒(méi)出現(xiàn)限制的情況。
我測(cè)試了以下 10 種場(chǎng)景,各個(gè)都非常驚艷!
注意:用的時(shí)候,記得先點(diǎn)更多,選擇創(chuàng)建圖片后再輸出提示詞,在提示詞前面會(huì)有藍(lán)色的“創(chuàng)建圖片”,確保使用新模型且生效。
10 個(gè)最常用的使用場(chǎng)景案例
1. 生成組圖
我測(cè)試的第一個(gè)生成圖片,就是直接挑戰(zhàn)高難度,讓它在一個(gè)畫(huà)面中同時(shí)生成一批帶有對(duì)應(yīng)特征的內(nèi)容。這在目前其他 AI 生圖能力上基本都超綱了,咱們直接上強(qiáng)度,看看它到底行不行?
提示詞:一張正方形圖片,包含一個(gè) 4 行 4 列的網(wǎng)格,網(wǎng)格上有 16 個(gè)圖形,背景為白色,從左到右,從上到下。圖形的風(fēng)格請(qǐng)保持和參考圖一致,列表如下:1、一塊橙色的面包 2、一個(gè)白色的星巴克杯子 3、一個(gè)草莓蛋糕 4、一瓶牛奶 5、一瓶汽水 6、一杯奶茶 7、一張桌子 8、便利店 9、一只戴著帽子的狗 10、一輛紅色的小汽車(chē) 11、一束玫瑰花 12、一把黑色雨傘 13、一雙紅色高跟鞋 14、幾個(gè)包子 15、用草書(shū)寫(xiě)的“caiyun”16、辦公樓
效果出來(lái)了,16 個(gè)元素,位置、內(nèi)容完全正確,風(fēng)格和細(xì)節(jié)程度還做到了統(tǒng)一,非常棒!
接著,我想把它的風(fēng)格按我提供的參考圖重新設(shè)計(jì)下,畢竟在實(shí)際項(xiàng)目里,需要的風(fēng)格比較確定,風(fēng)格要做到一致性。
提示詞:參考這張圖,把上面的圖風(fēng)格改成和參考圖一致
這是生成后的效果,開(kāi)始有一些錯(cuò)誤了。所以,我不滿足,讓它繼續(xù)改。
有一些修正,但也還是會(huì)有問(wèn)題,所以我想把它改回來(lái),看看有沒(méi)有修正回來(lái)的可能性,就和在實(shí)際工作中指導(dǎo)實(shí)習(xí)生的感覺(jué)。
提示詞:再仔細(xì)對(duì)照最初的參考圖和設(shè)計(jì)要求,顏色沒(méi)有這么多,有幾個(gè)地方的內(nèi)容出錯(cuò)了,第 2 個(gè),第 7 個(gè),第 10 個(gè)
最終改了幾輪后,有些改回來(lái)了,但又出了新的錯(cuò)誤,我打算就此打住。
雖然它的效果還不是很完美,但總體上拿來(lái)稍微改改其實(shí)就能用了,已經(jīng)給了我不小的驚喜,因?yàn)槲乙餐瑫r(shí)把這個(gè)提示詞問(wèn)了谷歌 gemini,出來(lái)的圖是這樣的。
只能說(shuō),沒(méi)有對(duì)比就沒(méi)有傷害。
2. 風(fēng)格轉(zhuǎn)換
GPT-4o 有類(lèi)似 ComfyUI 中的 ControlNet 的功能,可以完全復(fù)刻參考圖中的人物姿勢(shì),或根據(jù)線稿生成指定風(fēng)格的圖像。
給大家看下我當(dāng)時(shí)測(cè)試的一個(gè)例子。
提示詞:把上圖中的畫(huà)面轉(zhuǎn)換為 3D 風(fēng)格
轉(zhuǎn)換后的圖,已經(jīng)非常像了有沒(méi)有,這還學(xué)啥建模啊?質(zhì)量也太高了。
眼尖的你可能會(huì)發(fā)現(xiàn),生成后的圖和原圖稍微會(huì)有點(diǎn)區(qū)別,但這其實(shí)是官方刻意為之,不是做不到。因?yàn)楫?dāng)我要求它跟原圖一樣時(shí),就違反規(guī)定了。
可能大家在操作的時(shí)候,經(jīng)常會(huì)出現(xiàn)一個(gè)限制提示,說(shuō)你違反了他們的規(guī)定。OpenAI 的內(nèi)容政策特別嚴(yán)格地限制“高度擬真人物”的圖像生成,尤其是當(dāng)提示詞中涉及“肖像還原”“外貌匹配”等字樣時(shí),哪怕是你自己的照片,模型出于防止誤用(例如深度偽造)的政策,也有可能拒絕生成。
所以當(dāng)出現(xiàn)人物相關(guān)需求時(shí),可以用回 comfyUI 或 Gemini,能解決問(wèn)題。
此時(shí),我已經(jīng)不滿足于把帶人物的插畫(huà)轉(zhuǎn)成照片,我想把我覺(jué)得很美的插圖壁紙也都轉(zhuǎn)成照片了,那會(huì)是什么樣的美景呢?咱們?cè)囋囆Ч?/p>
提示詞:把這個(gè)場(chǎng)景變成一張寫(xiě)實(shí)照片
這是它生成出來(lái)的效果。
當(dāng)我看到它生成出來(lái)的效果時(shí),我真的是被驚艷到了,這效果還原的確實(shí)是有點(diǎn)太好了。
我在出這張圖的時(shí)候已經(jīng)是晚上 12 點(diǎn)多了,但我已經(jīng)沒(méi)了睡意,想趕緊多試試,這錢(qián)沒(méi)白花呀。
我又找了另外一張我很喜歡的風(fēng)景插圖轉(zhuǎn)換成了真實(shí)美景。
除了轉(zhuǎn)成通用的卡通風(fēng)格,還可以在提示詞中加入指定的漫畫(huà)家風(fēng)格,使其更有對(duì)應(yīng)風(fēng)格的特點(diǎn)。比如我把上一篇文章中生成的美女圖換成海賊王風(fēng)格會(huì)是什么樣的?
提示詞:將參考圖變成海賊王的畫(huà)風(fēng)
再轉(zhuǎn)成樂(lè)高風(fēng)格,提示詞:將參考圖變成樂(lè)高的畫(huà)風(fēng)
我還想把哪吒的 3D 圖改為哆啦 A 夢(mèng)的風(fēng)格。
提示詞:將參考圖變成藤子不二雄風(fēng)格
風(fēng)格轉(zhuǎn)換后,有點(diǎn)大雄的感覺(jué)啊,哈哈。
3. 生成海報(bào)
它能根據(jù)自身的知識(shí)庫(kù),生成符合用戶意圖的配圖。
比如我希望它幫我生成一張宇宙百科示意圖。
提示詞:我需要給百科全書(shū)畫(huà)一張插圖,請(qǐng)幫我用矢量插圖風(fēng)格生成一張不同類(lèi)型的星球插圖,需要有對(duì)應(yīng)星球的名字,一句話介紹,背景為白色
這是生成出來(lái)的效果,質(zhì)量很高啊,文字也都是對(duì)的。這在之前的生圖模型中,其實(shí)很難做到,現(xiàn)在居然這么準(zhǔn)確了。
英文沒(méi)問(wèn)題,那中文如何呢?我又試了下
提示詞:把圖中的英文改成中文
發(fā)現(xiàn)基本都能對(duì)上,不過(guò)也有一些小瑕疵,比如錯(cuò)別字,筆畫(huà)粗細(xì)之類(lèi)的細(xì)節(jié)還有提升空間,不過(guò)基本上稍微改改就能用了。
然后我又覺(jué)得太背景太干,適當(dāng)加多一些細(xì)節(jié)。
提示詞:背景上需要加多一些設(shè)計(jì)感,能用在書(shū)籍的宣傳插圖
背景加的還可以,還能繼續(xù)微調(diào),就像在指導(dǎo)一位設(shè)計(jì)實(shí)習(xí)生一般,沒(méi)有脾氣,不會(huì)疲勞,可以一直改,就問(wèn)老板們喜不喜歡?設(shè)計(jì)師們怕不怕!
4. 虛擬試穿
GPT-4o 能把提供的衣服、模特素材,直接合成想要的畫(huà)面,完成電商里面經(jīng)常用到的試穿效果圖。這個(gè)能力其實(shí)在 comfyUI 和 Gemini 中都能做到,但我發(fā)現(xiàn) GPT-4o 出來(lái)的效果似乎會(huì)更好。
提示詞:把褲子,帽子,衣服穿到模特身上,并且走在街道上
出來(lái)的效果非常好,除了帽子 logo 那稍微有點(diǎn)瑕疵,其他幾乎完全被復(fù)刻了過(guò)來(lái)。瞬間感覺(jué)用 comfyUI 搭建的工作流已經(jīng)失去了意義。
5. 動(dòng)漫設(shè)計(jì)
它可以一次性上傳多個(gè)角色設(shè)定,然后要求 GPT-4o 轉(zhuǎn)換視角和場(chǎng)景,生成全新的漫畫(huà)設(shè)定,同時(shí)保留漫畫(huà)角色特征。
提示詞:讓鳴人和路飛這 2 個(gè)角色在中忍考試的場(chǎng)景中激烈的戰(zhàn)斗,畫(huà)面中有相應(yīng)角色的技能特效
直接這樣會(huì)提示違規(guī),猜測(cè)可能是有版權(quán)的問(wèn)題。按它提示繼續(xù)操作就可以了,依然能保持參考圖的特征,繞過(guò)限制。
但在出來(lái)的圖片這里,手臂是有點(diǎn)問(wèn)題的,我們也可以用它的局部修改功能。怎么操作呢?
點(diǎn)擊圖片放大,然后點(diǎn)右上角有一個(gè)編輯圖標(biāo)
點(diǎn)完之后,可以看到一只畫(huà)筆,然后把想修改的地方圈出來(lái),寫(xiě)上提示詞就可以了。
這是優(yōu)化之后的,能看到還是有一些瑕疵,還可以繼續(xù)優(yōu)化,我這里就不演示了。
6. 改圖標(biāo)風(fēng)格
在 UI 領(lǐng)域,也可以讓它根據(jù)一種風(fēng)格生成對(duì)應(yīng)的圖標(biāo)。咱們?cè)O(shè)計(jì)師經(jīng)常找參考圖,做情緒版,不就是為了做好風(fēng)格設(shè)計(jì)嗎?這下 GPT-4o 也能搞了,而且還挺精細(xì)。
比如讓它按找到的設(shè)計(jì)參考圖,重新設(shè)計(jì)圖標(biāo)。
提示詞:按照第 1 個(gè)風(fēng)格圖標(biāo)重新設(shè)計(jì)第 2 張圖中的圖標(biāo)
最后生成的效果,雖然圖片還存在一定的瑕疵,比如透視關(guān)系不大對(duì),但這個(gè)效果還是非常不錯(cuò)的。
一整套圖標(biāo)時(shí)也可以出效果
最后的效果也還不錯(cuò),除了第一個(gè)圖標(biāo)有瑕疵。
7. 圖像提取
GPT-4o 可以從圖像中摳圖,它還不是一種簡(jiǎn)單的摳圖,而是扣出畫(huà)面內(nèi)容,然后幫你做高清修復(fù)。
比如我找到了這張圖,水中的海豚其實(shí)已經(jīng)很不清晰了,整個(gè)圖片也不到 700px,要想摳出來(lái)完整細(xì)節(jié)挺不容易的。
提示詞:幫我把畫(huà)面中的海豚提取出來(lái)
看到了嗎?它不是簡(jiǎn)單的摳圖,而是把需要摳圖的海豚完整的摳出,而且還自帶了修復(fù),并且還給了一張透明格式的圖片!
8. AI 找圖
它不僅能按提示詞出圖,還能根據(jù)它自己的知識(shí)庫(kù),根據(jù)我的一句話描述,直接把我想要的圖“找”出來(lái)。
提示詞:找一張火影里面的小櫻的圖
這是幫我找出來(lái)的圖,質(zhì)量非常高,幾乎沒(méi)有啥瑕疵。
9. 老舊照片上色
這個(gè)功能其實(shí)其他 AI 也有,只是我覺(jué)得 GPT-4o 出來(lái)的圖更好,尤其是在那些細(xì)節(jié)還原度上,甚至景深那些都能比較好的復(fù)原。
比如我從網(wǎng)上找到這樣一張照片,我覺(jué)得挺有質(zhì)感的,咱們來(lái)實(shí)驗(yàn)一波。
提示詞:為這個(gè)老照片變?yōu)椴噬?/p>
這是修復(fù)后的照片,細(xì)節(jié)還原度拉滿。
10. 一鍵修圖
它的修圖能力,感覺(jué)比 PS 還要強(qiáng),一鍵就把畫(huà)面中的人物全干沒(méi)了。
提示詞:修改圖片,要求移除畫(huà)面中所有人,完全保留畫(huà)面中的其他實(shí)景細(xì)節(jié)
這是修完之后的效果,除了細(xì)微處還有點(diǎn)瑕疵外,乍一看,幾乎挑不出毛病。
好了,以上就是我自己在測(cè)試中覺(jué)得最實(shí)用的 10 個(gè)使用場(chǎng)景,它還有更多其他用法等待大家去發(fā)現(xiàn),留言區(qū)期待你的發(fā)現(xiàn)和分享。
當(dāng)前這個(gè)模型也不是完美的,它也有一些做的沒(méi)那么好的地方。比如對(duì)中文的生成還沒(méi)那么好,對(duì)一些細(xì)節(jié)做遷移的時(shí)候會(huì)有一些瑕疵,限制比較多,出圖速度上也比較慢,而且動(dòng)不動(dòng)還限速,挺麻煩的,然后它在一些出圖的美感上也有點(diǎn)不太足,和 Midjourney 稍差一些。但我覺(jué)得,這些問(wèn)題很快就會(huì)被迭代解決,畢竟 AI 領(lǐng)域的更新節(jié)奏實(shí)在是太快了。
從各家大模型卷的方向來(lái)看,都是先保實(shí)用性,再提升美感。這和咱們平時(shí)做產(chǎn)品的思路一樣,先保證可用,再做到好看。
從天馬行空的驚喜到精準(zhǔn)可控的生成,這就是這次升級(jí)中最核心的升級(jí)內(nèi)容。
最后說(shuō)點(diǎn)心里話。
從最初 Midjourney 剛出的時(shí)候,就有一種聲音在說(shuō)設(shè)計(jì)師要下崗了,不再需要設(shè)計(jì)師了。但后面這種聲音也隨著實(shí)際項(xiàng)目中的應(yīng)用情況而逐漸回歸理性,設(shè)計(jì)師還是沒(méi)法被取代。而到近期 GPT-4o 出來(lái)時(shí),大家更能感覺(jué)到工具的好用,設(shè)計(jì)師下崗論似乎更加強(qiáng)烈。
但我覺(jué)得此時(shí)如果真的被取代的不是設(shè)計(jì)師,而是只會(huì)畫(huà)圖的美工,進(jìn)而會(huì)進(jìn)一步拉大初級(jí)和資深設(shè)計(jì)師之間的鴻溝。畫(huà)圖在實(shí)際項(xiàng)目中,只是設(shè)計(jì)師日程工作中的一部分,項(xiàng)目前期的需求溝通、概念策劃、后期與開(kāi)發(fā)的對(duì)接、還原走查、用戶反饋后的分析、策略調(diào)整都是工作,而這個(gè)鏈路暫時(shí)都需要設(shè)計(jì)師的介入,沒(méi)法完全實(shí)現(xiàn) AI 代辦。
雖然我覺(jué)得設(shè)計(jì)師完全被取代不大可能,但我隱約看到一種趨勢(shì):距離直接畫(huà)圖越近的設(shè)計(jì)師,越容易被取代。而在項(xiàng)目中做設(shè)計(jì)項(xiàng)目管理,做概念策劃的人,負(fù)責(zé)節(jié)點(diǎn)較多的人會(huì)比較難被取代。原因是流程多,組織團(tuán)隊(duì)復(fù)雜,需要人的介入就更多,越不容易被 AI 自動(dòng)化。
所以,苦心鉆研技術(shù)可能并不會(huì)有出路,關(guān)鍵還是策略的思考。如果你想依賴(lài)學(xué)習(xí)到的技術(shù)做為壁壘,當(dāng)你苦心學(xué)習(xí)了很多年的各種技能,結(jié)果被給 AI 說(shuō)的一句話就打敗了,想想還是有點(diǎn)悲哀的吧。
歡迎關(guān)注作者的微信公眾號(hào):「彩云譯設(shè)計(jì)」
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
標(biāo)志設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 729 位幸運(yùn)星
發(fā)表評(píng)論 為下方 15 條評(píng)論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓