大家好,我是言川。
Midjourney 在近期終于迎來了新的圖像模型的發(fā)布,這是自V6模型以來長(zhǎng)達(dá)一年多的時(shí)間首次重大更新(Midjourney V6 模型于2023年12月21日發(fā)布)。
最新發(fā)布的模型也是大家期待已久的 V7 模型,但注意,這個(gè)模型是 V7 Alpha 版本,Alpha 表示的是測(cè)試版本。
感覺像是被 GPT-4o 逼著提前發(fā)布的,而 Midjourney 官方也表示,在未來兩個(gè)月內(nèi),他們將每周或每?jī)芍芨乱淮涡鹿δ堋?/p>
那本篇文章,我將深入測(cè)評(píng) Midjourney 在本次更新的內(nèi)容。此外,我還會(huì)將 GPT-4o 模型與 Midjourney V7 Alpha 進(jìn)行對(duì)比測(cè)試,看看到底現(xiàn)階段哪個(gè)圖像模型更適合我們使用。
這也是“自回歸模型”和“擴(kuò)散模型”之間的 PK。
首先,Midjourney 在本次更新中,主要焦點(diǎn)是新的 Midjourney V7 Alpha 模型。除了模型本身的更新,還新增了三項(xiàng)功能:個(gè)性化功能、草稿模式以及運(yùn)行模式,咱們挨個(gè)嘮。
1. 全新模型(V7 Alpha)
V7 Alpha 模型在圖像質(zhì)量方面有了進(jìn)一步的提升,主要體現(xiàn)在細(xì)節(jié)處理、場(chǎng)景理解和藝術(shù)風(fēng)格上。生成的圖像在人物、手部和物體細(xì)節(jié)上更加連貫自然,材質(zhì)紋理和光影效果表現(xiàn)更精細(xì)。
下面我測(cè)試了幾組 V6.1 模型和 V7 Alpha 的效果圖,大家可以對(duì)比著看一下。
提示詞:寫實(shí)風(fēng)格的年輕女性人物,穿著簡(jiǎn)約的白色襯衫,坐在窗邊,陽光透過窗戶灑在她的臉上,背景是模糊的城市景觀,頭發(fā)自然垂落,面部表情安靜,眼神溫柔,光線柔和,細(xì)節(jié)清晰,焦距為 50mm,光圈 f/1.8,快門速度 1/200 秒,ISO 100,突出溫暖與寧靜的氛圍。相機(jī)使用全畫幅傳感器,拍攝角度為正面,景深淺,背景虛化,人物清晰可見。
提示詞:電影質(zhì)感的男性人物大片,穿著深色西裝,站在昏暗的街道上,霓虹燈在背景中閃爍,街道上有輕微的雨水反射,燈光在濕漉漉的地面上形成美麗的光斑,面部表情堅(jiān)定且深邃,眼神銳利,背景虛化,突出人物的孤獨(dú)與決絕感,焦距為 50mm,光圈 f/1.8,快門速度 1/160 秒,ISO 400,低光環(huán)境下拍攝,深景深效果,光影對(duì)比強(qiáng)烈,充滿電影感的氛圍。
提示詞:一張低角度拍攝的照片,展示一輛堅(jiān)固的越野 SUV,配備大型全地形輪胎,在泥濘的森林小徑上行駛,車輛覆蓋著一層薄薄的泥土,背景是樹木和山脈,SUV 配備了車頂行李架和后部安裝的備胎,展現(xiàn)出堅(jiān)韌和冒險(xiǎn)的外觀,電影級(jí)光線,高細(xì)節(jié),使用大疆 Mavic Air 2 無人機(jī),廣角鏡頭,大地色調(diào)。
提示詞:一只超可愛的貓娘,采用中國風(fēng),穿著古代服飾,佩戴華麗的頭飾和耳環(huán),擬人化程度極高,粉色的面容,頭部有白虎紋理,融合中國元素,使用 ZBrush 制作,淺紅色調(diào),細(xì)致的面部特征表現(xiàn),白色背景,盲盒藝術(shù)風(fēng)格,粘土材質(zhì),工作室燈光,Octane 渲染。
提示詞:網(wǎng)絡(luò)漫畫故事板,Shiniez 風(fēng)格,21 歲的前衛(wèi)亞洲女孩,現(xiàn)代風(fēng)格但帶有賽博朋克氛圍,頭發(fā)上有彩色高光和太空包發(fā)型,坐在她發(fā)光的電腦屏幕前,雙腿盤坐在臥室里,房間里充滿了毛絨玩具和科技小物件,面部表情自信,屏幕的光反射在她大而富有表現(xiàn)力的眼睛里。
2. 個(gè)性化功能
Midjourney V7 Alpha 版本引入了個(gè)性化模型功能,可根據(jù)用戶的個(gè)人審美偏好,提供更加精準(zhǔn)和個(gè)性化的圖像生成。
個(gè)性化功能是在首次使用 V7 Alpha 時(shí)必須進(jìn)行的步驟,并且, 隨著使用時(shí)間的增加,模型會(huì)不斷學(xué)習(xí)和優(yōu)化,生成效果會(huì)逐漸貼近你的審美和創(chuàng)作風(fēng)格。
我建議大家認(rèn)真選擇下,因?yàn)槟闼x擇的結(jié)果,會(huì)影響你后續(xù)的生圖效果。
比如,我在選擇時(shí),比較偏向藝術(shù)類、油畫類的圖像,在開啟個(gè)性化功能后,Midjourney 會(huì)將我所描述的寫實(shí)風(fēng)格圖像,生成的偏向于藝術(shù)類的效果。
提示詞:超寫實(shí)女性肖像,身著優(yōu)雅晚禮服,站在經(jīng)典室內(nèi)場(chǎng)景中,背景有柔和光線和精致裝飾。她的表情溫和而自信,發(fā)型精致。光滑的皮膚,復(fù)雜的光影和陰影,豐富的細(xì)節(jié),銳利的焦點(diǎn),展現(xiàn)柔和溫暖的色彩搭配。
當(dāng)然,如果你不想讓它影響你的生圖結(jié)果,嚴(yán)格遵循提示詞的描述,也可以關(guān)閉該功能。
3. 草稿模式
Midjourney V7 Alpha 引入了全新的草稿模式,使圖像渲染速度提升至標(biāo)準(zhǔn)模式的 10 倍,同時(shí)成本降低 50%。需要注意的是,草稿模式下生成的圖像分辨率相對(duì)較低,適合快速生成初步草圖。
草稿模式有兩種使用方式,分別是通過文字指令生成和語音指令生成。
文字指令:開啟“Draft Mode”功能后,輸入提示詞指令(支持中文輸入)。注:此處的指令可以是自然語言。
比如:生成一張照片,照片的內(nèi)容是一位年輕女性,穿著現(xiàn)代休閑服飾,站在城市街頭。
Midjourney 會(huì)根據(jù)指令自動(dòng)優(yōu)化提示詞,并快速生成。
生成的提示詞:young woman, modern casual attire, standing on a city street, vibrant urban background, natural lighting, realistic style
中文提示詞:年輕女子,現(xiàn)代休閑裝,站在城市街道上,充滿活力的城市背景,自然采光,寫實(shí)風(fēng)格。
并且,該功能支持多輪對(duì)話,類似于 GPT-4o 的多輪對(duì)話修改圖像。
比如:讓她的服飾更加時(shí)尚,換上一件流行的外套,背景加一些街頭藝術(shù)壁畫。
草稿模式下,還有個(gè)“Enhance”功能。這個(gè)功能的作用就是將這組提示詞生成的圖像,以正常的 V7 Alpha 生圖的速度和質(zhì)量重新生成。
也就相當(dāng)于,你在進(jìn)行多輪對(duì)話修改圖像后,覺得這組提示詞所生成的圖像效果符合你的要求,那么就轉(zhuǎn)換到正常生圖的步驟,這樣生成的圖像質(zhì)量會(huì)更高、效果更好。
最后生成的結(jié)果如圖所示:
語音指令:通過自然語言處理技術(shù)來理解和解析用戶所發(fā)出的指令,從而生成圖像。
錄了一段通過語音來控制生圖的視頻,可以播放看看。
下面通過文字描述的方式來解析下這段操作:
如圖所示,在功能區(qū)的頂部開啟草稿模式后,再點(diǎn)擊語音功能。
然后用電話聊天的方式,輸出需要生成的圖片,比如:幫我生成一張電影感十足的真實(shí)感照片,場(chǎng)景設(shè)定在日落時(shí)分的巴黎街頭。
生成的結(jié)果如圖所示:
繼續(xù)多輪對(duì)話修改圖像,比如:在照片中添加一位時(shí)尚的美女,她手上拿著咖啡杯,站在咖啡館門口。
繼續(xù),語音下達(dá)指令,如:我想讓照片變成黑白風(fēng)格,營造出一種懷舊的電影效果。
繼續(xù)第四輪對(duì)話,如:在背景中添加一輛經(jīng)典的老式汽車,??吭诮诌?,增強(qiáng)畫面的時(shí)代感。
最后,你還可以結(jié)合 Midjourney 的其他功能來優(yōu)化圖片,比如:我覺得第二張圖片效果不錯(cuò),幫我放大。
以上就是草稿模式的全部?jī)?nèi)容,總的來說,草稿模式就是讓你能快速的生成草圖,只需要你不斷地發(fā)揮創(chuàng)意、想象,而設(shè)計(jì)、創(chuàng)造圖像的工作,交給 Mijdourney 就好。
但目前我測(cè)試下來,發(fā)現(xiàn)該功能不是特別穩(wěn)定,特別是在多輪對(duì)話時(shí),會(huì)出現(xiàn)斷層,還有其他的小 BUG,我的體驗(yàn)感不是特別好......
4. 運(yùn)行模式
最后一個(gè)更新的功能,就是運(yùn)行模型的選擇了。V7 Alpha 目前支持兩種運(yùn)行模式:Turbo 和 Relax,在頂部的功能設(shè)置區(qū)中可以找到。
Turbo 模式:提供更快的圖像生成速度,但生成所消耗的成本是 V6 模型的 2 倍(Fast 模式)。
Relax 模式:在生成速度和成本之間提供平衡。
以上是官方的介紹,但嚴(yán)格意義上說,V7 Alpha 是支持 4 種運(yùn)行模式的,另外兩種就是草稿模式和 Fast 模式。
Fast 模式:快速模式,僅次于 Turbo 模式的生成速度。
草稿模式:圖像渲染速度提升至標(biāo)準(zhǔn)模式(Relax)的 10 倍,成本僅為標(biāo)準(zhǔn)模式的一半。
當(dāng)然,除了草稿模式外,Relax、Fast、Turbo 模式在圖像生成質(zhì)量上并無差異,僅體現(xiàn)在速度和生圖成本上。
上面就是 Midjourney 更新的全部?jī)?nèi)容了,主要亮點(diǎn)就是這個(gè)新模型 V7 Alpha,作為擴(kuò)散模型的老牌大哥,也終于是在“自回歸模型” GPT-4o 的強(qiáng)勢(shì)崛起下,再次站了出來!
但是,V7 Alpha 模型到底能不能與 GPT-4o 模型相媲美,現(xiàn)在還不能下結(jié)論,我們得來測(cè)評(píng)對(duì)比下。
本次測(cè)評(píng)主要聚焦于三個(gè)關(guān)鍵領(lǐng)域:提示詞的遵循性、文本渲染效果以及風(fēng)格的多樣性。
這些領(lǐng)域是我近期在撰寫測(cè)評(píng)文章時(shí)發(fā)現(xiàn)的共同點(diǎn),無論是新模型還是舊模型,它們的優(yōu)化基本都會(huì)圍繞著這三個(gè)核心要素進(jìn)行。而這三個(gè)領(lǐng)域也恰恰可以體現(xiàn)模型的性能,所以還是比較嚴(yán)謹(jǐn)?shù)?.....
1. 提示詞遵循
在這一部分,我們得先關(guān)掉 Midjourney 的個(gè)性化功能,避免它影響我們生成的風(fēng)格偏向個(gè)性化所篩選的圖像。
讓 Kimi 幫我寫了一段復(fù)雜的提示詞,將提示詞的結(jié)構(gòu)分為前景、中景以及后景,看看這兩模型是否準(zhǔn)確的依照提示詞的描述生成。
提示詞:生成一張寫實(shí)電影風(fēng)格的圖像,畫面分為前景、中景和后景。
前景是一個(gè)沙灘,沙灘上散落著各種貝殼和海星,貝殼有螺旋形的、扇形的,顏色包括白色、粉色和淡黃色。海星呈橙紅色,有五個(gè)觸角,觸角上有細(xì)小的顆粒。沙灘上有幾塊光滑的鵝卵石,大小不一,顏色從淺灰到深褐不等。沙灘上有一雙白色的涼鞋,涼鞋旁邊有一個(gè)裝滿海水的小水坑,水坑中倒映著天空和周圍的景物。
中景是一棵高大的椰子樹,樹干彎曲,樹葉茂密,呈扇形展開。椰子樹下有一張木質(zhì)的沙灘椅,沙灘椅上鋪著一條藍(lán)白條紋的沙灘巾。沙灘椅旁邊有一把遮陽傘,傘面是紅色的,傘桿是白色的,傘下有一張小桌子,桌子上放著一杯裝有冰塊的藍(lán)色飲料,飲料上漂浮著一片檸檬。
后景是一片蔚藍(lán)的大海,海面波光粼粼,有幾艘白色的帆船在海面上航行。海天相接處有幾座連綿的山脈,山脈頂部被云霧籠罩。天空中有幾只白色的海鷗在飛翔,翅膀展開,姿態(tài)優(yōu)雅。天空呈現(xiàn)出漸變的藍(lán)色,從淺藍(lán)到深藍(lán),云朵潔白且蓬松,分布在天空的不同位置。 整體畫面采用寫實(shí)電影風(fēng)格,注重細(xì)節(jié)的細(xì)膩表現(xiàn)和光影效果的自然過渡,色彩自然且和諧,畫面質(zhì)感豐富,具有電影般的沉浸感。
首先來看下 GPT-4o 模型所生成的效果:
生成的結(jié)果真的很讓我驚訝,如果你對(duì)照提示詞挨個(gè)去檢查圖片中的細(xì)節(jié)元素,你會(huì)發(fā)現(xiàn),非常精準(zhǔn)。
再看看 Midjourney V7 Alpha 生成的結(jié)果,不是想故意抹黑它。生成了非常多組圖片,發(fā)現(xiàn)沒一個(gè)與提示詞對(duì)上的,哪怕只是前景(一般前景的內(nèi)容在圖像生成時(shí),是最不容易出錯(cuò)的)。
這回合,Midjourney V7 Alpha 完敗。提示詞遵循度在我看來,是商業(yè)化生圖場(chǎng)景中非常重要的能力,這是平衡 AI 自主發(fā)揮創(chuàng)意和讓 AI 聽話的關(guān)鍵。
然而,Midjourney 模型一直以來都沒優(yōu)化這個(gè)能力,或者是不夠重視這個(gè)功能。Midjourney 模型讓 AI 自主發(fā)揮的權(quán)重遠(yuǎn)遠(yuǎn)大于人類所下達(dá)的指令。
2. 文本渲染
在上篇 Idegram 3.0 的測(cè)評(píng)文章中,有展示大量的文本渲染的案例,而 Idegram 3.0 所表現(xiàn)出來的能力也非常強(qiáng)(英文)。
在本章節(jié),我們就用 Idegram 3.0、GPT-4O、Midjourney V7 Alpha 這三個(gè)圖像模型來進(jìn)行測(cè)試對(duì)比下。
提示詞:一張復(fù)古風(fēng)格的星際迪斯科活動(dòng)海報(bào)設(shè)計(jì)。畫面中央是一張漂浮在宇宙場(chǎng)景中的巨大黑膠唱片。
背景是橙紅色漸變的天空,點(diǎn)綴著白色的輕薄云朵和星星。在畫面的上部,一個(gè)紫色和藍(lán)色的彎月散發(fā)著光芒。場(chǎng)景設(shè)置在粉色網(wǎng)格地板上。
頂部用白色字母顯示“INTERSTELLAR GROOVE”,兩側(cè)分別標(biāo)注“05.11”和“10PM”。底部用白色文字顯示場(chǎng)地名稱“THE DOLPHIN”,下方依次用較小的文字標(biāo)注“DISCO ? HOUSE ? COSMIC FUNK”和“MUSIC BY ED CHRISTOF”。
整個(gè)設(shè)計(jì)被一個(gè)裝飾有紅色加號(hào)的黑色邊框包圍。整體色彩以紅色、橙色、紫色和黑色為主,營造出復(fù)古未來主義的美學(xué)風(fēng)格。作品采用數(shù)字插畫風(fēng)格,具有光滑的漸變和干凈的線條。
GPT-4o 生成的結(jié)果如圖所示,沒什么問題,文本渲染能力其實(shí)也是與提示詞遵循能力掛鉤的。
再看看 Midjourney 所生成的結(jié)果,海報(bào)中的元素設(shè)計(jì)的比較混亂,文字部分對(duì)比 GPT-4o 有明顯的差距。
最后,Ideogram 3.0 模型生成的效果,在文本渲染方面不輸 GPT-4o 模型,至于海報(bào)設(shè)計(jì)的美感方面,我認(rèn)為是略高于 GPT-4o 模型。
我們?cè)賮砜纯粗形牡匿秩灸芰Π?,但結(jié)果其實(shí)都能預(yù)料到,這些都是海外的圖像模型,除了 GPT-4o 是大語言模型,有中文語料作為支撐以外。
提示詞:生成一個(gè)四宮圖,風(fēng)格為漫畫風(fēng)格,分為四個(gè)場(chǎng)景:
發(fā)現(xiàn)小貓:小明站在操場(chǎng)上,手指著草叢,表情驚訝。草叢中露出一只小貓的頭部,小貓看起來很警惕。背景是學(xué)校的操場(chǎng),有籃球架和跑道。文字:“小明發(fā)現(xiàn)操場(chǎng)有貓?!?/p>
試圖接近:小明彎著腰,慢慢向小貓靠近,表情小心翼翼。小貓蹲在草叢中,耳朵向后貼,顯得有些害怕。背景是學(xué)校的操場(chǎng),陽光灑在草地上。文字:“小明輕手輕腳靠近。”
小貓?zhí)优埽盒∝埧焖倥荛_,小明愣在原地,表情驚訝。背景是學(xué)校的操場(chǎng),小貓跑向教學(xué)樓的方向,小明站在原地,手還保持著指向的姿態(tài)。文字:“小貓突然跑開了?!?/p>
成功互動(dòng):小明蹲在地上,手里拿著一塊面包,表情溫柔。小貓慢慢靠近,聞著面包的氣味。背景是學(xué)校的操場(chǎng),陽光明媚,其他同學(xué)在遠(yuǎn)處活動(dòng)。文字:“小明用食物吸引小貓?!?/p>
GPT-4o 所生成的中文字,雖然字形會(huì)有問題,但文字信息其實(shí)是可以被識(shí)別的。
Midjourney V7 Alpha 和 Ideogram 3.0 模型所生成的中文字完全無法識(shí)別。
綜合來看,在文本渲染方面,還是 GPT-4o 表現(xiàn)最優(yōu)。
3. 風(fēng)格多樣性
最后,我們?cè)賮砜聪?Midjourney V7 Alpha 模型在圖像生成的風(fēng)格方面表現(xiàn)如何,這也是 Midjourney 長(zhǎng)期以來的強(qiáng)項(xiàng)。
本章節(jié),我們劃分為四大風(fēng)格場(chǎng)景進(jìn)行測(cè)評(píng)對(duì)比,分別是寫實(shí)風(fēng)格、插畫風(fēng)格、3D 風(fēng)格以及超現(xiàn)實(shí)主義風(fēng)格。
① 寫實(shí)風(fēng)格
寫實(shí)風(fēng)格的特點(diǎn)是以精細(xì)的細(xì)節(jié)、真實(shí)的質(zhì)感和自然的光影效果,精確還原現(xiàn)實(shí)世界的視覺特征。
提示詞:在一個(gè)昏暗的酒吧里,四個(gè)年輕人站在一起。兩名男性和兩名女性,具有不同的發(fā)型和風(fēng)格。第一名男性有卷曲的頭發(fā)和輕微胡須,穿著條紋的米色夾克和淺綠色的 T 恤。第二名男性有短小的卷發(fā)和胡子,穿著一件簡(jiǎn)單的棕色毛衣。第一名女性有長(zhǎng)而波浪狀的淺棕色頭發(fā),穿著一件米色的超大外套。第二名女性有及肩的直發(fā),深棕色,穿著一件米色的上衣和休閑夾克。背景是溫馨的酒吧,貨架上擺滿了酒瓶,暖黃色的燈光營造出輕松的氛圍。人物面部表情平靜自信,背景的柔和燈光突出了他們的面容,創(chuàng)造出一種親密的氛圍。
提示詞:創(chuàng)作一位年輕女性的正面肖像,穿著寬松的白色連帽衛(wèi)衣,戴著大號(hào)圓形黃色漸變太陽鏡。她的頭發(fā)是淺色的,松散地扎成一個(gè)高馬尾,微微朝前看,展現(xiàn)出自信和活力。她一只手輕觸著太陽鏡的一邊,面部表情自然且輕松。背景是藍(lán)紫色的,燈光呈現(xiàn)霓虹效果,藍(lán)色和紫色的光交織,給人物增添未來感。整體氛圍現(xiàn)代、時(shí)尚,注重光影和色彩的搭配。
提示詞:創(chuàng)作一幅描繪一只興奮的白色小型犬在跳傘的畫面。狗狗穿著橙色的跳傘服,表情歡快,舌頭伸出,笑容燦爛。它的毛發(fā)被風(fēng)吹得蓬松,眼睛明亮,顯得十分開心。背景是湛藍(lán)的天空和飄動(dòng)的白云,下面的地面清晰可見。使用魚眼鏡頭拍攝,視角夸張,狗狗的面部在鏡頭中放大,四周的云朵呈現(xiàn)彎曲效果,增強(qiáng)了飛行的動(dòng)感和俯瞰視角的效果。整體畫面呈現(xiàn)出高寫實(shí)風(fēng)格,細(xì)致展現(xiàn)狗狗的毛發(fā)、表情和飛行中的動(dòng)感,陽光透過云層照射在狗狗身上,營造出一個(gè)興奮、刺激且歡樂的場(chǎng)景。
提示詞:創(chuàng)作一幅寫實(shí)風(fēng)格的照片,展示一個(gè)寧靜的海灣景色。畫面中的海水湛藍(lán)清澈,與白色的沙灘相接,周圍有壯麗的巖石峭壁,巖石表面呈現(xiàn)金色和棕色的溫暖色調(diào),局部有綠色植物點(diǎn)綴。遠(yuǎn)處的海面與藍(lán)天相接,天空中有飄動(dòng)的白云。畫面呈現(xiàn)出柔和的陽光,水面上反射著溫暖的光線,營造出寧靜、放松的氛圍。拍攝使用 Canon EOS 5D Mark IV 相機(jī),搭配 24-70mm f/2.8 鏡頭,使用 f/8 光圈,快門速度 1/200 秒,ISO 200,捕捉到清晰的海灣細(xì)節(jié)和層次感,畫面深度和細(xì)膩的光影效果。
② 插畫風(fēng)格
插畫風(fēng)格的特點(diǎn)是通過藝術(shù)化的線條、色彩和構(gòu)圖,以夸張、簡(jiǎn)化或抽象的方式表達(dá)創(chuàng)意和情感,具有強(qiáng)烈的視覺沖擊力和藝術(shù)感染力。
提示詞:創(chuàng)作一幅吉卜力風(fēng)格的動(dòng)畫場(chǎng)景,畫面中的女孩穿著紅色外套,背著棕色背包,手中拿著一束黃色的野花。她站在陽光明媚的田野中,四周是金黃色的秋季樹木和綠意盎然的草地,天空中有幾朵白云,陽光灑在她的臉上,女孩的表情充滿好奇和喜悅,眼神溫柔。背景中有幾座小木屋,整體畫面充滿溫馨、寧靜的氛圍。畫面采用吉卜力風(fēng)格,細(xì)致地描繪了女孩的服裝、花束、草地、樹木和天空中的細(xì)節(jié),色彩鮮明,光影效果自然,人物的表情和動(dòng)作生動(dòng),呈現(xiàn)出濃厚的手繪動(dòng)畫風(fēng)格,創(chuàng)造出一幅溫暖、清新的鄉(xiāng)村風(fēng)光。
提示詞:創(chuàng)作一幅 2D 動(dòng)漫風(fēng)格的插圖,描繪一位女孩面部有紫色淚水流下,淚水在光線下反射出迷人的光澤。女孩的眼睛閃爍著紫色的光芒,表情顯得憂傷而柔弱,淚水沿著她的臉龐流下,帶有神秘和悲傷的氛圍。背景使用深紫色和藍(lán)色的色調(diào),增強(qiáng)光澤感和反射效果,突出女孩的頭部。畫面中的光線和反射效果增強(qiáng)了角色的情感表達(dá),整體氛圍充滿夢(mèng)幻與憂傷,呈現(xiàn)出強(qiáng)烈的視覺沖擊感。
提示詞:創(chuàng)作一幅描繪一位可愛女孩的插圖,她戴著眼鏡,手里拿著一朵玫瑰。女孩穿著白色的長(zhǎng)袖衣服,頭發(fā)扎成一個(gè)松散的發(fā)髻,整體畫面呈現(xiàn)出一種簡(jiǎn)潔、優(yōu)雅的風(fēng)格。背景是柔和的淺綠色,散發(fā)出溫暖、浪漫的氣氛。插圖具有亞洲風(fēng)格的美學(xué),畫面采用類似浪漫漫畫的風(fēng)格,強(qiáng)調(diào)人物的柔和線條和精致的細(xì)節(jié)。整體風(fēng)格融合了浪漫學(xué)術(shù)氛圍,突出人物的純凈和優(yōu)雅,帶有一種夢(mèng)幻般的浪漫氣息。
提示詞:一幅充滿活力的插畫,描繪馬尼拉市區(qū)的街道,采用粉紅色、粉藍(lán)色和粉黃色的色調(diào)。圖像從鳥瞰視角呈現(xiàn),街道兩旁是多層建筑,商店門面和街道充滿生動(dòng)的顏色。車流在街道上行駛,行人散步,電線與建筑之間交錯(cuò)。天藍(lán)色的背景上點(diǎn)綴著幾朵白云,整個(gè)畫面具有復(fù)古、低飽和的色調(diào),充滿了都市氣息和日常生活的氛圍。
③ 3D 風(fēng)格
3D 風(fēng)格的特點(diǎn)是利用立體建模和光影渲染技術(shù),創(chuàng)造出具有深度、空間感和真實(shí)感的三維視覺效果,常用于虛擬場(chǎng)景和動(dòng)態(tài)表現(xiàn)。
提示詞:正面視角,3D 風(fēng)格的卡通男孩,穿著可愛的白色毛衣和綠色圍巾,圍巾呈明亮且鮮艷的綠色,呈現(xiàn)強(qiáng)烈的發(fā)光效果。角色的身體部分發(fā)出光芒,展現(xiàn)出一種機(jī)械精密感,穿著造型獨(dú)特的可愛靴子,整體呈現(xiàn)出非?!発awaii”風(fēng)格。色調(diào)豐富且充滿活力,采用包豪斯風(fēng)格的設(shè)計(jì),且充滿了現(xiàn)代感和未來感。使用電影級(jí)光照,細(xì)節(jié)呈現(xiàn)數(shù)字藝術(shù)風(fēng)格,粘土風(fēng)格的質(zhì)感,背景為全黑色。使用 C4D Octane 渲染,Blender 制作,高清細(xì)節(jié)。
提示詞:Jellycat 風(fēng)格的毛絨玩具,外形是一個(gè)星巴克咖啡杯,上面有奶油,眼睛像小豆子,微笑的表情。背景簡(jiǎn)潔,顏色鮮艷,腳部是纖細(xì)的棕色小腳,材質(zhì)使用毛線,呈現(xiàn)出柔軟的質(zhì)感。3D 渲染效果,采用 Jellycat 風(fēng)格,毛絨玩具的面料充滿質(zhì)感,輕松的背景與自然光照亮整個(gè)玩具,呈現(xiàn)出高質(zhì)量的前視角產(chǎn)品攝影,極致的細(xì)節(jié),柔軟蓬松的紋理。
提示詞:一幅迪士尼皮克斯風(fēng)格的場(chǎng)景,展現(xiàn)了一對(duì)年輕情侶在日落時(shí)分自拍,站在一座俯瞰遠(yuǎn)處城市的風(fēng)景小山上。男孩有著淺金色的刺猬頭發(fā),明亮的藍(lán)色眼睛和俏皮的微笑,穿著休閑的白色 T 恤。女孩的頭發(fā)是柔和的淺棕紅色,及肩,她對(duì)著鏡頭溫暖地微笑,穿著帶有白色花卉圖案的綠色連衣裙。天空充滿了橙色和粉色的鮮艷色調(diào),太陽在他們身后落下,灑下溫暖的金色光芒。背景是遠(yuǎn)處的城市,周圍被綠色的山丘環(huán)繞,捕捉到了一個(gè)寧靜又充滿歡樂的瞬間。
④ 超現(xiàn)實(shí)主義風(fēng)格
超現(xiàn)實(shí)主義風(fēng)格的特點(diǎn)是打破現(xiàn)實(shí)邏輯,通過扭曲、變形和重組現(xiàn)實(shí)元素,創(chuàng)造出夢(mèng)幻、荒誕且富有想象力的視覺效果,營造出神秘而獨(dú)特的藝術(shù)氛圍。
提示詞:一幅超現(xiàn)實(shí)且細(xì)膩的插畫,描繪了一位擁有藍(lán)色眼睛的亞洲女性面孔,長(zhǎng)長(zhǎng)的鼻梁,周圍環(huán)繞著粉色的房屋,風(fēng)格類似 K-pop。背景是開闊的自然景觀,有山脈、河流、建筑、街道場(chǎng)景、汽車、花朵、樹木,以及穿著女孩裝扮的角色。整體采用粉彩色調(diào),并融入幾何形狀。插畫的分辨率極高,呈現(xiàn) 3D 效果,并以鳥瞰視角呈現(xiàn)。這是一幅超現(xiàn)實(shí)主義藝術(shù)作品。
提示詞:展現(xiàn)大自然的壯麗與黃金天國的力量,畫面中有美麗的天堂大門,金色的塔樓和城堡熠熠生輝。遠(yuǎn)古文明的痕跡散落在這片奇幻的景觀中,城市金光閃耀,氣氛寧靜而神秘。畫面中的白色身影緩步走向那道通往永恒的門戶,象征著通往未知的旅程。場(chǎng)景充滿了幻想藝術(shù)風(fēng)格,細(xì)節(jié)繁復(fù)且精致,所有元素以超現(xiàn)實(shí)的方式呈現(xiàn)。整體風(fēng)格受約瑟芬·奧維爾(Josephine Owell)影響,呈現(xiàn)出宏偉與神秘并存的氛圍。
提示詞:一張色彩斑斕的迷幻風(fēng)格女性面部圖像,面部被打破的玻璃片覆蓋,碎片反射出鮮艷的光芒,創(chuàng)造出一種超現(xiàn)實(shí)的氛圍。整體風(fēng)格為超現(xiàn)實(shí)主義,高分辨率和高細(xì)節(jié),強(qiáng)烈的對(duì)比度,明亮的色彩,展現(xiàn)出碎片間的光影變化,反射與折射的美感。采用廣角視角,展現(xiàn)女性的面部特征與玻璃碎片的結(jié)合,創(chuàng)造出既夢(mèng)幻又充滿張力的視覺效果。
案例展示至此,大家對(duì)于 Midjourney V7 Alpha 模型的表現(xiàn)有何看法?與 GPT-4o 模型相比又如何?
來分享一下我的觀點(diǎn):
Midjourney V7 Alpha 模型在圖像的藝術(shù)性和創(chuàng)意性方面表現(xiàn)出色。雖然 GPT-4o 模型生成的效果也非常好,特別是在人物生成的真實(shí)性上,但它缺少了 Midjourney 所生成的藝術(shù)感效果。
特別是在超現(xiàn)實(shí)主義風(fēng)格這種純藝術(shù)、純想象力的作品上,Midjourney V7 Alpha 模型具有絕對(duì)優(yōu)勢(shì)。
以上就是本篇文章的全部?jī)?nèi)容了。
Midjourney 的此次更新,在我看來,就是雷聲大雨點(diǎn)小。它們的 CEO 在 GPT-4o 剛發(fā)布時(shí)曾對(duì)后者進(jìn)行過吐槽,并宣稱 Midjourney V7 將更勝一籌。然而,從目前的情況來看,這次的更新與之前的 V4 到 V6 的升級(jí)頗為相似,主要還是在圖像效果上進(jìn)行了提升。
至于新推出的草稿模式和個(gè)性化功能,我用起來感覺沒什么卵用,甚至是副作用......
比如,開啟個(gè)性化功能后,即使我在提示詞中明確要求生成寫實(shí)風(fēng)格的圖像,它還是給我生成插畫風(fēng)格的圖像,曾一度讓我崩潰。而草稿模式,說實(shí)話,我可能在寫教程會(huì)為了演示用下,之后大概率不會(huì)用。
除非,草稿模式能升級(jí)成類似 GPT-4o 這種獨(dú)立的對(duì)話框,可以進(jìn)行多輪對(duì)話修改圖像,且不會(huì)被中斷。
不過,V7 Alpha 模型在生成寫實(shí)人物方面確實(shí)給我留下了深刻的印象,生成的人物形象逼真至極。所以,在接下來的兩個(gè)月內(nèi),Midjourney 的更新還是值得期待的。
樹欲靜而風(fēng)不止,這句話很適合 Midjourney 近 1 年的“不作為”。
好了,以上純屬我胡說八道,僅供參考,有不同意見的寶可以在評(píng)論留言,咱們下期再見~
如果你想學(xué)習(xí) AIGC,可以加入我主理的《優(yōu)設(shè) AI 俱樂部》,俱樂部?jī)?nèi)沉淀有 2000+ 優(yōu)質(zhì) AI 學(xué)習(xí)資料,涵蓋 AI 繪畫、AI 視頻、AI 提示詞、AI 工具庫、AI 商業(yè)設(shè)計(jì)案例、研究報(bào)告......
也可以點(diǎn)擊鏈接: https://wx.zsxq.com/group/15288828142182
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
標(biāo)志設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 729 位幸運(yùn)星
發(fā)表評(píng)論 為下方 17 條評(píng)論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓