熟悉 Midjourney、Stable Difusion 等 AI 繪畫工具的朋友可能遇到這樣一個問題:在圖像中生成或嵌入精確的文本可能會比較困難。
現在不必太擔心了,阿里巴巴集團的研究人員已經開源了一款名為 AnyText 的多語言視覺文字生成與編輯模型。
AnyText在生成文字方面的控制能力可以媲美專業的PS,用戶可以自定義文字出現的位置,以及圖片的強度、力度、種子數等參數。
目前,它在Github上已經獲得了超過2,400顆星的好評。并且 AnyText 可以作為插件無縫集成到其他開源擴散模型中,從而全面增強了圖像嵌入精準文本的能力。