大家好,我是花生~
上周,知名 AI 模型基準測試平臺 Artificial Analysis 的文生圖榜單里,突然多了一個名為 “red_panda” 的新模型,并且力壓 FLUX1.1 Pro、FLUX.1 Pro、Ideogram v2、Midjourney v6.1 和新出的 SD 3.5 Large 等一眾模型,直接空降在了第一名的位置。
消息傳開后很快引起了人們的關注,大家都在猜測這個模型的真身是什么,有人猜是即將到來的 Midjourney v7,也有人說是 OpenAI 的 DALL·E 4,畢竟它最喜歡突然整個大活了(比如 Sora)。最后是 10 月 31 號一家名為 Recraft 的公司在 Twitter 上發文認領了該模型,表示 red_panda 就是自家最新訓練的 Recraft v3 模型。
可能大部分人都不知道這家公司,但關注我文章的小伙伴肯定對 Recraft 這個名字有印象。早在去年 6 月份,我就向大家推薦過 Recraft 這款工具,因為它是當時唯一一款可以通過文本生成矢量圖像的商業 AI 工具(好像到目前為止也依舊是),后來又再次推薦了它的位圖矢量化功能,非常好用。
過去的一年半時間里,Recraft 一直都沒有什么大的動作,可以說是純純的小透明。我之前一直都希望它能繼續在文生矢量圖這個賽道上深耕,這樣我們就能更方便地獲得高質量的可編輯圖像。所以在知道 red_panda 是 Recraft 的新模型時,我還是挺驚喜的,沒想到向來默默無聞的它可以一下發布這么強大的模型。
而且 Recraft 官方直言 v3 是 “一款以設計語言思考的革命性人工智能模型”,這就讓我更感興趣了,下面就一起來看看這款 v3 模型是如何 “以設計語言思考” 的吧~
推薦閱讀:
做為一款文生圖大模型,Recraft v3 的基礎能力非常扎實,這點在前面的 ELO 評分上有直觀體現。官方表示 v3 的主要優勢有 4 點,分別是強大的文本渲染能力、正確的人體比例呈現、準確的提示詞理解和極高的風格審美水平。
① 文本渲染能力
Recraft v3 可以正確渲染出超長、且排版合理的英文文本內容,雖然官方說它是 “世界上唯一可以生成帶有長文本圖像的模型”,但其實之前的 Ideogram v2.0 和 Flux.1 也可以生成長文本內容。所以這一點暫時不做評價,反正對用戶來說帶這種功能的模型自然是越多越好。
提示詞:A robot holding chalk looking at a blackboard that reads the following poem:"ln pixels’ dance, AI’s craft will rise, Transforming visions through machine eyes, From dreams to screens, new worlds unfurled, AI’s brush reshapes our visual world."
② 正確的人體結構生成
無法正確生成人的手指、腳趾細節,以及人物肢體動作容易發生扭曲變形,是 AI 出圖一直都存在的問題。Recraft 則表示經過專門訓練后,v3 模型可以保證這些人體結構正確生成,同時在場景的空間連貫性、以及背景相對主體的自然定位上有優秀表現。
我還拿之前常用的幾組提示詞是試了一下,從結果來看 Recraft 在手指等細節上的表現的確不錯,比 flux.1 Pro 都好,并且在動態上更多樣、自然。
③ 準確的提示詞理解
Recraft v3 可以準確理解復雜的提示詞,正確生成提示中包含的物體數量、顏色和位置。我用官方給的示例提示詞,分別在 MJ、Flux.1 Pro 和 SD 3.5 Large 中測試了一下,結果三家生成的圖像都沒有準確反映出提示詞的內容,由此看見 Recraft v3 在這一點上的確很強。
④ 風格審美
在圖像美學水平上,Midjourney 是目前毋庸置疑的第一,Recraft 見賢思齊也在這一方面做了專門的訓練。
其實在前面的對比圖中也能看出來,它的美學質感并不輸 MJ 的,并且明顯優于 SD 3.5 和 Flux.1 Pro。尤其是在進入 Recraft 的 Community 社區時,真的有眼前一亮又一亮的感覺,不僅圖像風格多樣,而且每一張的質感都很好,讓人忍不住細細觀賞,感覺 Midjourney 真的有對手了。
Recraft Community 直達: https://www.recraft.ai/community
在提升模型基礎生成能力之外,Recraft 也深知對實際的圖形設計任務來說,只有高質量的圖像是遠遠不夠的,用戶更需要有足夠多的控制手段,來精準實現自己的想法。因此 v3 模型在經過訓練后,可以提供比其他模型更豐富的圖像控制功能,包括定位排版設計、風格訓練遷移、矢量圖像生成和 AI 樣機功能。
① 定位排版設計
Recraft v3 可以根據用戶提供的參考圖,生成相似構圖的新圖像,也就是既 SD-Controlnet 和 Midjourney-Retexture 后,我們又有了一個新的支持精準控制的文生圖工具。
這個功能在 Refcraft 中稱為 Frame。選中該模式后,你可以新建畫布添加文字排版,或直接上傳設計稿,然后填寫關鍵詞,設置控制強度、配色主題,最后點擊生成。經過測試,我覺得雖然該功能在風格質感上雖然略遜于 MJ,但在操作便捷性和控制效果上還是非常給力的。
② 風格訓練遷移
該功能類似于 Midjourney 的 Style Reference 風格參考功能,用戶可以上傳 5 張圖像,訓練為一個簡易版的 Lora 并儲存。之后再生成圖像時,可以選擇這個自定義風格實現準確一致的風格應用效果。
下面是前期訓練風格階段的界面截圖,我上傳的是 5 張用 Midjourney 生成的圖像。從測試結果來看,風格延展地非常不錯,操作也很簡單,這為解決 Recraft 風格不夠多樣提供了一個新的思路。
③ 矢量圖像生成
升級后的 Recraft 并沒有丟棄它原有的矢量圖像生成、編輯功能,這非常棒。它支持的操作包括:
- 直接通過文本生成不同風格的矢量文字、圖形內容,并支持一鍵切換不同的上色效果;
- 將 AI 生成或用戶上傳的圖像轉為矢量可編輯格式;
- 支持導出為 SVG 格式,可以繼續在 Adobe Illustrator 等軟件中編輯。
支持矢量編輯對設計師和插畫師來說有多重要無需贅述,究竟有多好用大家自己去操作一下就知道了。
④ AI 樣機功能
套樣機是設計里最常見的操作之一,所以 Recraft 也很貼心的把這一項的功能加上去了。
我們可以直接通過 v3 模型生成經典樣機模板,包括模特、衣服、杯子、書籍、電子產品等; 然后再生成或上傳設計稿,比如 Logo、圖標、插畫、文字等,接著你就可以隨意調整設計稿在樣機上的擺放位置及大小,Recraft 會自動實現完美融合,然后再一鍵導出為成品圖。
官方操作界面直達: https://www.recraft.ai/invite/7gqb7GkOwN
Recraft 目前可免費試用,新用戶每天有 50 個免費積分,生成一張圖像扣除一個積分,額度還是比較充足的。
雖然模型全面升級了,Recraft 依舊沿用了無限畫布式的操作界面。使用時,需要先新建一個 Project 項目,然后在空白畫布的任意位置新建一個或多個畫板,進行圖像的生成、修改、編輯等操作。
Recraft 還提供了一整套完整的圖像編輯功能,幫助用戶更好地進行設計工作。傳統的有圖層管理、色彩調整、畫筆、文本輸入等;AI 方面有局部重繪、內容消除、高清放大、生成變體、位圖矢量化、背景扣除、背景重新生成等。一些簡單的封面、banner 設計工作可以直接在其中完成,無需借助其他工具。
篇幅所限我就在本篇內介紹詳細的操作教程了,AI 工具的用法都很簡單,官方也提供了詳細的操作指引,相信你一看就會;如果需要的話可以在評論區留言,人多的話我會考慮出一篇詳細用法/技巧介紹。
雖然 Recraft v3 模型在實測中并沒有到全面超越現有模型,但是它在基礎性能、審美質感上已經超越 Flux.1 和 SD 3.5,可以與 Midjourney v6.1 一較高下;而它基于設計思維構建、聚合的一系列功能,更是獨此一家別無分店,的確是更適合處理設計任務的 AI 工具,非常推薦設計師、插畫師都去體驗一下。
那么以上就是本期推薦的內容,喜歡的話記得點贊收藏支持一波,我會更有動力為大家推薦新的 AI 干貨。如果你還不了解 AI 繪畫的相關內容,可以看看我的課程 《零基礎 AI 繪畫入門指南》。這是一門面向 AI 繪畫零基礎人群的系統課程,有全面細致的用法教學,并提供配套資源,能幫你快速掌握 Midjourney 和 Stable Diffusion 這兩款目前最熱門的 AI 繪畫工具。
想了解更多設計神器的話,歡迎關注優設網 神器推薦專欄 和優設微信視頻號,也歡迎大家掃描下方的二維碼加入“優設 AI 知識交流群”,和我及其他設計師一起交流學習 AI 知識~
相關鏈接:
推薦閱讀:
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 21 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓