熱評 Young

比較齊全的一個總結,也看出了這短短半年多時間的井噴速度,可以說什么時候進場都不會遲的,所以現在開始就玩起來吧

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

大家好我是花生~

還有幾天 2023 年就結束了,過去的 1 年里生成式 AI 技術發展迅速,出現了很多優質的 AI 工具,今天就為大家盤點其中我覺得非常不錯的那些產品~

相關推薦:

一、AI 聊天機器人

① ChatGPT

過去 1 年是大語言模型發展的井噴之年,但是說起目前最強大的 AI 聊天機器人,卻依舊是 1 年前橫空出世的 ChatGPT。ChatGPT 的目前內置的是 GPT-4V 多模態模型,可以處理圖像、音頻等多種類型的信息,性能也比之前的 GPT-3.5 要好。今年 ChatGPT 還出了手機 APP,可以實現語音交互,支持中英等多種語言,對用戶來說使用更便捷。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

ChatGPT 還在今年推出了插件(Plugins)功能,賦予其使用工具、聯網、運行計算的能力,讓 ChatGPT 的能力有了進一步的擴大和提升。而 11 月份推出的 GPTs 則更進一步,讓用戶能夠按需要定制 AI 工具來輔助自己完成任務。GPTs 還可以互相分享,我們可以直接使用別人構建好的 AI 工具,目前也有很多 GPTs 資源網站可以使用。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

② Bard

Google Bard 目前內置了最新的原生多模態大模型 Gemini Pro,這是谷歌歷史上最強大、最通用的模型,可以吸收任何類型的輸入和輸出,包括文本、代碼、視頻、音頻和圖像。對我們普通用戶來說,Bard 的獲取便捷度要比 ChatGPT 好很多,還是免費的,作為 ChatGPT 的平替來使用非常不錯。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

③ 文心一言

百度在今年 10 月份的時候發布了文心大模型 4.0,與原來的基礎模型相比在理解、生成、邏輯和記憶能力上都有著顯著提升,并且也有插件功能。“一言百寶箱”中有很多 AI 小工具,可以幫用戶直接解決各種類型的問題,而像考公資料、寫教案、寫黨政報道這樣的特色功能則只有中文大語言模型里才能找到,這也是國產模型相比國外模型的優勢。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

④ Microsoft Copilot

Copilot 其實就是之前的微軟 New Bing Chat,今年 11 月份改為了 Copilot。它目前依舊集成在 Edge 瀏覽器中,內置的是 GPT-4 模型,并支持調用 DALL·E 3 生成圖像。當我們在瀏覽器搜索框內輸入問題進行搜索后,AI 自動總結好的好答案,鼠標滾輪上劃能看完整內容和信息的來源,還能切換不同的模式與 AI 進行對話,日常用來查找信息非常方便。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

⑤ Perplexity

問 AI 聊天機器人問題時,我們最擔心的一點就是它會“胡編亂造”,給我們錯誤的信息,而 Perplexity AI 可以解決這個問題。

Perplexity 準確來說是一個 AI 驅動的搜索引擎,利用 GPT-4 模型,綜合最新的信息(包括新聞、學術、視頻等)為用戶提供準確、權威的答案,并且還會附上答案的引用源,方便用戶檢驗信息是否正確,還支持識別圖像和上傳文檔。它的界面設計非常簡潔,交互高效并具有成沉浸感,月訪問量曾一度躋身所有網頁 AI 應用的前 10,僅次于 Midjourney 和 Huggingface。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

⑥ Poe

Poe 之前專門給大家推薦過了,它目前接入的大語言模型包括 GPT-4、Claude、Gemini Pro、Llama 2 等,還支持調用 AI 繪畫模型 Dalle 3 和 Stable Diffusion XL,還有很多其他小工具可以使用,相當于是一個 AI 工具拼盤。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

二、AI 繪畫工具

① Stable Diffusion WebUI / Fooocus / ComfyUI

去年的 12 月份時 Midjourney 已經是 V4 模型了,圖像生成質量和清晰度大幅提升,一躍成為當時最受矚目的 AI 繪畫工具,而 Stable Diffusion 還處于 v2.1 版本,圖像生成效果并不好。時隔一年,現在 Stable Diffusion 的出圖質量與 Midjourney 已經沒有那么大的差距了,這主要得益于 Dreambooth/ Lora 這些技術的出現,還有就是新模型 Stable Diffusion XL 1.0 的發布。

過去的一年里 Stable Diffusion 的生態也進一步發展完善,高質量的開源模型不斷涌現,我們可以選擇的圖像風格越來越豐富;開源插件更是極大地拓寬了 Stable Diffusion 的能力,提高了圖像生成的可控性和處理效率,讓其成為目前平面、建筑、游戲等設計領域的首選 AI 工具。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

Stable Diffusion 目前最受歡迎的三種用戶操作界面分別是 Stable Diffusion WebUI、Fooocus 和 ComfyUI。

Stable Diffusion WebUI 最早出現,界面也最通用好理解,一鍵整合包的出現進一步降低了它的使用門檻,讓它成為目前普及率最高的開源 AI 繪畫軟件;基于 WebUI 開發的各種拓展插件也是目前最豐富的,所以它能處理的圖像任務種類最多、效率也最高,這讓 WebUI 成為新手學習 Stable Diffusion 首先要掌握的界面 ,想全面系統學習的小伙伴也可以解我最新制作的 《零基礎 AI 繪畫入門指南》 ,可以幫你快速高效地掌握 WebUI 這個熱門工具 ~

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

ComfyUI 則是節點式的工作界面,它其實也出現得很早,不過界面不及 WebUI 方便好用,早期生態也不夠完善,所以一直不怎么受關注。

而隨著拓展插件的豐富和 SDXL 模型的出現,ComfyUI 的優勢也逐漸出來。它生成圖像的速度更快,對硬件的要求更低,處理 SDXL 模型的效率比 WebUI 更高;模塊化形式讓用戶可以自己搭建工作流并隨時復用,會編程的話還可以自己編寫模塊和節點,以此滿足特殊或者定制化的需求。ComfyUI 相比 WebUI 來說更靈活專業,但是上手難度也更大,需要掌握 Stable Diffusion 的各種原理才能熟練運用。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

Fooocus 是今年 8 月份推出的操作界面,它使用的是 Stable Diffusion 的開源模型,交互方式借鑒則是 Midjourney。Fooocus 的界面非常簡單,用戶可以專注在提示詞和圖像上,無需進行復雜的參數設置就能生成高質量圖像,安裝也很簡單,所以很適合沒有復雜處理需求的用戶。Fooocus 目前還支持墊圖、局部重繪、外繪擴展、高清放大、生成變體等多種功能。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

② Midjourney

Midjourney 今年的更新升級也非常密集,推出過 V5、V5.1、V5.2、Niji 5 等版本,讓其圖像生成質量始終處理領先地位;也接連上線了 Zoom out 圖像拓展外繪、High Variation 高變體、Describe 圖像描述、Shorten 提示詞優化、Vary Region 局部重繪、Styler Tuner 風格生成器等功能,滿足用戶編輯圖像和探索風格的需求。

Stable Diffusion XL 1.0、Dalle 3 還有各種新的 AI 繪畫工具的接連出現也一度給了 Midjourney 不小的壓力,不過前幾天它又推出了新的 V6 版本,圖像的細節精細度達到令人驚嘆的水平,對提示詞的理解也更準確,還支持生成正確的英文文本內容,這讓 Midjourney 在 AI 繪畫領域依舊非常有競爭力。

Midjourney v1 到 v6 出圖效果對比,來源 Twitter @doganuraldesign

③ Adobe Firefly / PS beta

Adobe 在 4 月份的時候推出了自己的 AI 圖像生成模型 Firefly,支持文生圖、文生字體特效、局部重繪等多種功能,還將這些功能置入到了 Photoshop Beta 測試版中,讓設計師可以借助 AI 的力量更高效地完成設計工作。

10 月份的時候 Firefly Image Model 升級到了 2.0 版本,圖像生成質量比之前有了進一步提升,還支持人像調節、墊圖、鏡頭調色設置等多種功能,還有 Firefly Vector Model,支持通過文字生成矢量圖像,相信未來 Adobe 旗下的工具肯定會在 AI 的加持下更加好用。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

④ DALL·E 3

OpenAI 的 DALL·E 算是元老級別的 AI 繪畫工具了,最早的 DALL·E 1 在 2021 年 1 月的時候就出現了;DALL·E 2 在 2022 年 4 月份推出,以一張“宇航員騎著白馬”的清晰圖像啟發了人們對 AI 繪畫的認知。雖然技術一直走在前沿,不過 OpenAI 對其商業化這一塊很好像并不重視,所以知名度并不如其他 AI 繪畫工具。

雖然如此,9 月份 DALL·E 3 發布時依舊引起過廣泛關注,一方面是它對文本的理解遠超當時的其他 AI 繪畫模型,可以準確理解并呈現復雜提示詞中的所有元素,包括元素間的關系和文本內容;另一方便則是它和 ChatGPT 結合帶來的新交互方式,用戶直接用語言描述自己的需求,ChatGPT 會自動理解它并拆分生成任務,而無需用鼠標進行復雜的設置。從在某種程度上來說,ChatGPT 里的 DALL·E 3 才是最好用的 DALL·E 3。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

⑤ Krea AI

AI 繪畫在今年的一大技術進步就是出現了 LCM,可以一步完成圖像推理,讓圖像的生成時間縮短了 6-10 倍,并由此開啟了“實時生成”這種新的 AI 繪畫形式,Krea AI 就是最早將其商業化的應用。而隨著 LCM 和 SDXL Turbo 模型的開源,我們也可以在本地體驗這種超快的生成速度,或者在 ComfyUI 中自己搭建圖像實時生成的工作流。

有了實時生成,我們可以在畫板上控制畫面的元素、構圖、配色,再結合提示詞將其轉化為完整精致的圖像,并調整修改內容,這比在 WebUI 中重新生成或者局部重繪要高效很多,對電商、產品、電影、游戲概念等設計領域來說具有重要意義。

三、AI 音視頻工具

① Runway

Runway 無疑是目前最強的視頻生成和編輯應用,它既有正常的視頻剪輯功能,也有基于生成式 AI 的各項新功能,包括文生圖、圖生圖、文生視頻、圖生視頻、視頻風格化、文本生成語音、一鍵視頻摳圖、視頻內容抹除、動態追蹤等。

用 Runway 的 Gen-2 模型生成視頻時,可以調節視頻運動幅度,可以設置不同的鏡頭運動方式,還支持用運動筆刷控制畫面中的運動區域,以及視頻進行摳圖然后組合生成新的場景,這都讓視頻生成的可控性變得更強了。

② Pika

Pika 算是 AI 視頻生成領域的后起之秀,它也支持通過文本或者圖像生成視頻,也可以控制視頻動態強度和鏡頭運動方式,總體來說和 Runway 非常類似。最新的 Pika 1.0 則是讓它的功能更上一層樓,不但可以生成高質量的 2D/3D 動畫,還支持視頻擴展(Expand canvas)和區域修改(Modify region),讓 AI 視頻的趣味性變得更強了。

③ Domo AI

Domo AI 是最近才出現的一個 AI 視頻生成應用,功能包括文生圖、圖像風格轉化、圖像生成視頻和視頻風格轉換。由于它將真人視頻轉化為動漫、3D、像素等風格時非常穩定,效果比目前其他的 AI 視頻工具都優秀,所以非常受歡迎。

④ Heygen

前段時間郭德綱用英語說相聲的視頻讓 Heygen 爆火出圈,作為一個數字人視頻生成工具,Heygen 不僅有可以在神態上以假亂真的數字人形象,還提供了從人物選擇、內容制作到配音、視頻合成等一整套的服務,讓營銷視頻的制作變得前所有的簡單和高效。視頻對口型無痕翻譯則是其新推出的功能,給傳統視頻翻譯和影視制作帶來了一種新的處理思路。

用 Heygen 生成的數字人短視頻

⑤ 開源AI視頻工具

除了各種商業 AI 視頻應用外,我們也可以利用開源工具或模型在本地實現視頻生成,目前比較受歡迎的有 Animatediff 和最新推出的 Stable Video Diffusion。

大家在網上看到的“一個女孩的一生”或者人物變裝的視頻, 就是用 Animatediff 生成的。Animatediff 是一個拓展插件,可以安裝在 SD WebUI 或者 ComfyUI 中,實現文本生成視頻或者視頻轉風格。

Stable Video Diffusion 則是 Stability AI 最新推出的視頻模型,可以通過 ComfyUI 部署到到本地使用,免費將圖像轉為視頻。

⑥ 開源AI音頻工具

生成式 AI 技術也可以幫我們實現音頻的生成或處理,比如通過文本生成自然語音(TTS)、聲音克隆、通過文本生成音樂音效等,其中既有商業應用,也有可以部署到本地使用的開源的工具。

ElevenLabs 是目前比較成熟的商業 AI 語音生成應用,功能包括文本生成逼真自然語言以及克隆語音。而相似功能開源的工具則非常多,包括 so-vits-svc (聲音克隆)、Bert-VITS2、網易易魔聲(文本轉語音)等。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

之前還大家推薦過 6 款 AI 音樂生成工具,包括 Stable Audio、Soundraw、Suno AI 等,它們都可以生成高質量的音樂、音效以及歌曲。最近還出現了一個開源工具 Amphion,可以免費實現文本轉語音、語音克隆、文本生成音樂以及歌聲合成。

四、其他

AI 模型也促進了細分領域里 AI 工具的發展。比如有了大語言模型后,就催生了很多如 AI 簡歷生成器、AI 寫作工具,AI 翻譯器,AI PPT 生成工具這樣的細分應用。這里推薦一個我使用頻率非常高的 AI 翻譯工具——沉浸式翻譯,它可以實現網頁雙語對照翻譯,還支持在 YouTube、Netflix、Bilibili 等網站上顯示雙語字幕,對需要經常看英文網頁的小伙伴非常有用。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

AI 在 3D 模型領域也有不錯的進展。比如 Luma AI 可以通過視頻快速重建 3D 場景;Genie 可以通過文本生成高精度的 3D 模型,并導入其他 3D 軟件中進行再次編輯;最近還出現了一個 Stable Zero123 的模型,支持從單張圖像生成高質量的 3D 對象。

在 Genie 中用文本生成的 3D 模型

還有之前已經給大家推薦過很很多次的 AI 圖像處理工具,比如綜合圖像處理網站 Clipdrop、一鍵摳圖網站 Pixian AI、免費的圖像高清放大工具 Upscayl 等,有意識地運用這些 AI 工具可以讓我們更輕松地完成重復性的工作。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

Clipdrop 包含是多種圖像處理工具

那么以上就是本期為大家推薦的 2023 年 AI 神器,希望對大家有幫助 ~ 文章內提到的工具我我都整理成了一份文檔,大家可以掃描下方二維碼進群領取鏈接,也可以和群里的小伙伴們一起學習交流 AI 知識。

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

喜歡本期推薦的話記得點贊收藏支持一波,也可以分享給身邊有需要的朋友。如果像了解更多 AI 神器,大家可以訪問 「優設 AIGC 導航」 ,200 多款 AI 繪畫、設計、圖像處理神器等你探索。另外大家也可以關注我們「優設 AIGC」的 微信 視頻號,小瓜老師每天都會分享最新的 AIGC 資訊和神器,讓你輕松掌握最新的 AI 發展動態 ~

年度盤點!2023年不容錯過的30款AI神器,你用過多少?

推薦閱讀:

贊賞
收藏 292
點贊 123

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。