5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

前言

想不想了解近期 AI 圈又發(fā)生了哪些勁爆大事件?趕緊來看這篇文章 get 第一手 AIGC 資訊和深度測評——沒錯(cuò),我們的AIGC 30天測評又和大家見面了。

如今各類 AIGC 工具平臺百花齊放,我們的測評致力于持續(xù)追蹤最新的 AI 技術(shù)進(jìn)展,將 AI 圈內(nèi)發(fā)生的重大事件與工具進(jìn)行深度實(shí)測并匯總成文,定期發(fā)布帶給同學(xué)們,希望可以幫助大家快速了解最新的 AIGC 趨勢,并可以及時(shí)地將這些 AI 工具結(jié)合到工作、學(xué)習(xí)與生活中,運(yùn)用 AIGC 將自己的生活變得更加豐富多彩!

此前,我們已經(jīng)發(fā)布了第一期測評,如有需要各位同學(xué)可以點(diǎn)擊回顧。

另外與此前不同的是,本月我們對測評內(nèi)容的篩選流程進(jìn)行了升級。在持續(xù)大范圍監(jiān)控 AIGC 大模型與工具平臺的上新/更新之外,我們還開始對不同 AI 工具的相似功能進(jìn)行橫向?qū)Ρ葴y試,例如我們同時(shí)對 Remini 和 Midjourney 這兩個(gè) AI 工具進(jìn)行黏土風(fēng)格圖像生成的測試,并最終總結(jié)出了成功經(jīng)驗(yàn)分享給大家,希望可以幫助大家先人一步地拓展相關(guān)的 AI 能力邊界,所以這篇文章大家一定要看到最后哦。

接下來,就讓我們來看看近期 AIGC 的最新進(jìn)展吧!

第一章:近期 AI 圈大事件匯總

我們先來快速瀏覽一下近期 AI 圈發(fā)生的重要事件。每月的 AI 圈事件劃分為國內(nèi)和國外,依次做整理陳述。為了保證內(nèi)容的條理性,方便大家閱讀,我們用表格的形式呈現(xiàn)。順序?yàn)椴杉瘯r(shí)隨機(jī)排列,排名不分先后。

第 1 節(jié):國內(nèi)篇

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

第 2 節(jié):國外篇

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

第二章:近期重點(diǎn) AI 產(chǎn)品實(shí)測

第 1 節(jié):Remini

1)介紹概覽

Remini 的黏土風(fēng)格濾鏡在今年的五一“重塑”了世界,相信各位同學(xué)都被它狂刷屏了吧?接下來,我們來看看 Remini 黏土濾鏡的功能實(shí)測,同時(shí)也為大家奉上可替代 Remini 的黏土風(fēng)圖片制作方法,更方便設(shè)計(jì)師使用!

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

2)產(chǎn)品實(shí)測

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

Remini 的使用體驗(yàn)是比較簡單和快速的。下載 app 打開后,Remini 會提供為期一周的免費(fèi)試用(Remini 會在試用期截止后開始自動(dòng)收取最低 4.99 美元/周的訂閱費(fèi)用,所以如果不想繼續(xù)付費(fèi)使用的話,大家一定要記得在后臺取消訂閱喔),之后在操作界面上選擇第一位的粘土風(fēng)格,再上傳自己的圖片素材,等待十幾秒即可獲得轉(zhuǎn)換為可愛呆萌的黏土風(fēng)格圖像了!

以上就是基礎(chǔ)的黏土風(fēng)圖像制作的過程,不過作為專業(yè)的設(shè)計(jì)師,相信大家不會只滿足于此,所以接下來,我們?yōu)榇蠹覈L試了黏土風(fēng)進(jìn)一步的探索——利用AI圖片生視頻的軟件制作黏土動(dòng)畫。

目前市場上 AI 視頻生成軟件的選擇是比較豐富的,例如 Runway、Pika、VEED 等,在得到轉(zhuǎn)換為黏土風(fēng)格的圖片后,我們可以將圖片導(dǎo)入 AI 視頻軟件直接生成對應(yīng)的視頻。在這里我們就先以 Runway 為例,為大家演示一下黏土風(fēng)圖像轉(zhuǎn)視頻的效果:

我們可以看到動(dòng)起來的黏土風(fēng)動(dòng)畫的整體效果還是不錯(cuò)的,這樣動(dòng)態(tài)的呈現(xiàn)方式拓展了黏土風(fēng)的使用場景,不論是面對設(shè)計(jì)師、運(yùn)營從業(yè)者、自媒體博主等專業(yè)人群的工作需求,抑或用戶只是想為自己的照片增添獨(dú)特的魅力,這樣將原始圖像轉(zhuǎn)換為黏土風(fēng)格再轉(zhuǎn)換為動(dòng)畫的鏈路都能滿足。在此我們?yōu)榇蠹覓伌u引玉,各位同學(xué)可以基于此發(fā)散靈感,做更深入的探索。

那么回到 Remini 的效果測評,通過多次實(shí)測,我們發(fā)現(xiàn)適用于 Remini 黏土濾鏡的圖像特點(diǎn):

① 除了已被大量驗(yàn)證的真人圖片,Remini 對手繪插畫也可進(jìn)行 3D 化的黏土濾鏡轉(zhuǎn)換;

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

② 盡量選擇中近景,畫面色彩越豐富越好,更有趣味性和動(dòng)畫感;

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

③ 先把照片轉(zhuǎn)變成卡通風(fēng)格,然后再用黏土濾鏡會更好看。

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

與此同時(shí),在使用中我們也發(fā)現(xiàn) Remini 黏土濾鏡也不免存在 AI 生圖技術(shù)的一些共有缺點(diǎn):

①? 對圖像內(nèi)容的識別與判斷精準(zhǔn)度有欠缺,無法處理好圖片中的文字信息;

② 會修改原圖內(nèi)容;

③ 由于黏土濾鏡具有的手工感和粗糙感等特點(diǎn),一些非常精致的細(xì)節(jié)無法做到 100%還原;

④ 同一張圖片素材每次只能生成一張對應(yīng)的粘土風(fēng)格圖片,如果不滿意只能退回到第一步重新開始。

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

3)產(chǎn)品評價(jià)

總結(jié)來看,Remini 的黏土濾鏡使用門檻低,并且它的 AI 生成的黏土風(fēng)格效果非常逼真和生動(dòng),所以對于日常個(gè)人使用還是很適合的。其次,盡管每款濾鏡都會有它或長或短的生命周期,但是我們在測評過程中發(fā)現(xiàn),在短短的一周的時(shí)間里,Remini 從黏土風(fēng)濾鏡已經(jīng)拓展到了其它風(fēng)格的濾鏡,甚至研發(fā)出了新的多重濾鏡搭配玩法——這個(gè)可能才是一個(gè)產(chǎn)品可以生存下去的基礎(chǔ),用爆款做引子,引發(fā)用戶對產(chǎn)品的連鎖體驗(yàn)和傳播。

不過,如果期待在這個(gè)風(fēng)口上把 Remini 的黏土風(fēng)格直接使用在設(shè)計(jì)工作中,因?yàn)槠渥猿梢慌傻氖止じ泻汀俺竺却直俊憋L(fēng)格導(dǎo)致物料可能需要人工后期調(diào)整,且 Remini 不支持對生成圖像進(jìn)行修改或批量生成,這些缺點(diǎn)不適用于對畫面元素精準(zhǔn)度要求高及執(zhí)行效率要求較高的項(xiàng)目。看到這里,同學(xué)們可能感到有點(diǎn)心灰意冷,但是我們探索出了解決之道,大家請看下方詳解↓

4)設(shè)計(jì)師必看!復(fù)刻黏土風(fēng)格教程

盡管黏土風(fēng)刮得強(qiáng)勁,但 Remini 僅提供 7 天的免費(fèi)試用期,試用期結(jié)束了就需要開通 4.99 美元/周的會員才能使用,并不便宜;而且很多非蘋果用戶的同學(xué)們根本用不上。所以,我們貼心地為大家準(zhǔn)備了 Remini 的可替代方案——用Midjourney(以下簡稱MJ)也可以復(fù)刻出黏土風(fēng)格圖像!

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

我們的方法是用「墊圖+畫面描述+風(fēng)格關(guān)鍵詞」這一公式來獲得原圖對應(yīng)的黏土風(fēng)格圖像。首先,先在 MJ 上傳原始圖片素材并拷貝它的鏈接,輸入“/imagine"后粘貼圖像鏈接地址,在后面描述畫面內(nèi)容"a girl with brown long hair is talking to a cow on the grassland",再加上"clay animation style, 3D, vibrant color"這一組風(fēng)格關(guān)鍵詞,并將 iw 值設(shè)定在 1.5 左右,即可獲得黏土風(fēng)格的圖像。

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

第 2 節(jié). Heygen

數(shù)字人的熱度最近沒那么火熱了,但是依然有一些新的工具帶著更好的效果涌現(xiàn),同時(shí)一些老牌的 AI 數(shù)字人工具也在不斷的提升自己生成質(zhì)量,探索新的功能,今天就來講一下數(shù)字人領(lǐng)域的尖子生-Heygen。

1)介紹概覽

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

2)產(chǎn)品實(shí)測

接下來,我們來依次看一下 Heygen 都有哪些功能——

3)基礎(chǔ)功能

① 先來看一下 Heygen 的基礎(chǔ)功能,不需要購買 PRO 服務(wù),也就是有積分就可以使用的功能:圖片生成克隆人。只需要上傳一張圖片,輸入一段文字,接著可以選擇對應(yīng)的語言及聲音風(fēng)格,就能快速的生成一段真人說話的視頻。

這個(gè)功能整體生成的速度是很快的,最終的效果方面英文效果,要比中文的好一些;但能夠?qū)崿F(xiàn)用圖片生成克隆人類似功能的市面上競品也很多,Heygen 在這方面沒有明顯的優(yōu)勢,其中 D-ID,科大訊飛,都提供相似的功能,阿里的 EMO 和微軟最新的 VASA-1 的效果要更自然。

② 第二個(gè)要說的功能是視頻轉(zhuǎn)換語言,上傳一段講話的視頻,設(shè)置需要轉(zhuǎn)成的語言,就能快速生成一段嘴型準(zhǔn)確的翻譯后的語言視頻。這也是之前霉霉說中文的視頻,所使用的功能。

視頻來源 x @AliceFerdi15857

這個(gè)功能轉(zhuǎn)換的效果是非常自然的,幾乎很難看出來是 AI 生成的。又因?yàn)檫@個(gè)功能不需要開通付費(fèi)套餐,所以特別受歡迎。這樣的功能適合快速在不同的平臺上分發(fā)不同語言受眾的視頻。

4)高級功能

① 首先要提到的高級功能就是 Heygen 主要的視頻生成的克隆人,上傳一段 3-5 分鐘的人物的視頻,就能夠準(zhǔn)確的復(fù)制外表,肢體語言、手勢動(dòng)作和說話的聲音。生成不同的語言和文字內(nèi)容的視頻,也支持自己上傳音頻。生成后的視頻效果可以說是業(yè)內(nèi)頂尖的。

最厲害的是 Heygen 也是所有克隆人產(chǎn)品中,少有的能夠識別全身的肢體動(dòng)作,克隆走路動(dòng)作,生成一邊走一邊說的克隆人。真正的方便了內(nèi)容制作者,不需要每次都錄制內(nèi)容,只需要文字稿就能完成每期的視頻內(nèi)容創(chuàng)作。

當(dāng)視頻在手機(jī)上無法加載,可前往PC查看。

視頻來源:網(wǎng)絡(luò)

② 下面要講的一個(gè)高級功能是生成講解視頻,上傳一段 2-3 分鐘的視頻,就能夠定義企業(yè)專屬的人物形象,能夠配合需要講解的內(nèi)容,在軟件中移動(dòng)演講者的位置,輸入對應(yīng)的文字內(nèi)容,即可生成人物講解視頻。

視頻來源官網(wǎng)案例

這個(gè)功能適合做產(chǎn)品介紹。公司培訓(xùn)視頻。新聞播報(bào)等需要講解的視頻內(nèi)容。

這個(gè)功能一些數(shù)字人的競品也有,并且見到已經(jīng)有很多落地的,有商品介紹視頻、景區(qū)介紹視頻 、新聞播報(bào)。

③ 最后要提到的這個(gè)功能就是高級功能-實(shí)時(shí)互動(dòng)數(shù)字人

上傳一段視頻生成克隆數(shù)字人,或者使用之前生成的克隆人,加上大語言模型,就可以讓數(shù)字人和觀眾對話,實(shí)時(shí)渲染語音回答。支撐選擇知識庫,來讓數(shù)字人更好的回答細(xì)分領(lǐng)域的問題。(視頻錄屏有些卡頓)

功能實(shí)測

其實(shí)這個(gè)功能的簡版已經(jīng)有很多落地實(shí)踐了,已經(jīng)有了很多數(shù)字人的直播間,比如美團(tuán)上很多團(tuán)購的直播間,會使用數(shù)字人來直播,只是還沒看到能夠和觀眾的問題互動(dòng)的功能。

第 3 節(jié):通義聽悟 & 360AI 瀏覽器

這一節(jié)的選題是富媒體轉(zhuǎn)文字的 AI 工具,其中通義聽悟主打聲音轉(zhuǎn)文字(STT),360AI 瀏覽器主打視頻轉(zhuǎn)文字(VTT)。

① 介紹概覽_通義聽悟

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

網(wǎng)址: https://tingwu.aliyun.com/home

② 產(chǎn)品實(shí)測_通義聽悟

在聲音轉(zhuǎn)文字的賽道,我們見過太多“實(shí)時(shí)會議記錄”和“音頻解析文字”的產(chǎn)品和工具,甚至早年的科大訊飛錄音筆就能干上面這兩件事,此處我們選擇通義聽悟作為被測對象是看中了它的“播客鏈接轉(zhuǎn)寫”功能——我們假想這樣一個(gè)場景,當(dāng)研究一個(gè)新課題時(shí),除了快速在網(wǎng)絡(luò)上搜集文字素材外,一些深度解讀的播客內(nèi)容也是我們的素材來源。換做以前,我們只能耐著性子去聽播客里具體講了些什么;但是有了通義聽悟后,我們可以直接錄入目標(biāo)播客的節(jié)目鏈接,功能入口見下圖。

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

一般情況下會成功解析(如果由于版權(quán)問題無法解析,那就只能翻錄再手動(dòng)導(dǎo)入了),時(shí)長 1 小時(shí)的播客內(nèi)容,大概只需要 3-5 分鐘就能完成解析。通義聽悟?qū)τ谀艹晒馕龅牟タ唾Y源,會有以下好處:

  1. 直接跳過翻錄過程,大大縮減轉(zhuǎn)寫時(shí)間
  2. 可以快速定位錄音位置,方便核實(shí)文字內(nèi)容
  3. AI 總結(jié)歸納,方便快速了解全貌(如關(guān)鍵詞、摘要、章節(jié)速覽、發(fā)言總結(jié)、問答回顧)
  4. 其他 AI 工具的應(yīng)用,如下圖的 AI 改寫功能,幾乎可以做到“一鍵改寫”

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

③ 產(chǎn)品評價(jià)_通義聽悟

對于播客轉(zhuǎn)文字這一需求而言,通義聽悟簡直就是為此而生的。無論是快速采集播客里優(yōu)質(zhì)內(nèi)容素材,還是自己快速了解播客內(nèi)容,都是目前最好用的 AI 利器,過程絲滑且不花錢,感興趣或者有此類訴求的同學(xué)們不妨嘗試一下。

④ 介紹概覽_360AI 瀏覽器

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

下載地址: https://browser.360.cn/ai/?src=se

⑤ 產(chǎn)品實(shí)測_360AI 瀏覽器

類比通義聽悟的播客鏈接解析,360AI 瀏覽器可以直接轉(zhuǎn)寫在線視頻。現(xiàn)階段 360AI 瀏覽器只有 PC 端的安裝包,蘋果用戶無緣體驗(yàn)。

下載安裝后,用 360AI 瀏覽器打開你想要轉(zhuǎn)寫的視頻網(wǎng)頁,點(diǎn)擊瀏覽器右上角的 AI 按鈕,即可得到如下的頁面。

  1. 簡介 tab_瀏覽器會基于視頻內(nèi)容分析,AI 生成簡介和視頻結(jié)構(gòu)的腦圖
  2. 重點(diǎn) tab_瀏覽器會生成類似于整個(gè)視頻的時(shí)間軸信息
  3. 字幕 tab_VTT 功能,方便用戶提取優(yōu)質(zhì)視頻的觀點(diǎn)和文本內(nèi)容
  4. 問答 tab_用戶可以問一些視頻相關(guān)的問題,AI 瀏覽器會全網(wǎng)搜索并做出回答

5000字爆肝測評!五月 AI 資訊及實(shí)用測評合集

⑥ 產(chǎn)品評價(jià)_360AI 瀏覽器

類比通義聽悟,360AI 瀏覽器對于“視頻轉(zhuǎn)寫文字”的訴求是完全勝任的,但是沒有通義聽悟那么多 AI 相關(guān)的功能,比如“AI 改寫”、“區(qū)分發(fā)言人”等功能,不過也可以理解。通義聽悟基于阿里云等技術(shù)積累,早就開始著手 AI 產(chǎn)品的打造;而 360AI 瀏覽器 3 月 1 日才剛發(fā)布了第一個(gè)版本。在 AI 浪潮席卷而來的當(dāng)下,360AI 瀏覽器會預(yù)見性的越做越好,讓我們期待它的進(jìn)一步更新迭代。

結(jié)語

最后帶大家畫一下重點(diǎn)——

  1. Remini 的黏土濾鏡為大家提供了無門檻地 AI 使用體驗(yàn),同時(shí) Remini 也在積極拓展更多風(fēng)格的 AI 濾鏡,也很具有趣味性,大家可以多多嘗試。為了更好的將黏土風(fēng)格應(yīng)用在工作中,我們?yōu)楦魑辉O(shè)計(jì)及運(yùn)營從業(yè)者提供了一套用 Midjourney 生成黏土風(fēng)格圖片的解決方案,各位同學(xué)可以與自己的工作內(nèi)容結(jié)合一下;
  2. Heygen 近期更新的 AI 視頻功能還是很強(qiáng)大的,涵蓋了人物換臉、文字轉(zhuǎn)口播視頻、創(chuàng)建虛擬主播及 AI 克隆人等,其中一大亮點(diǎn)就是 Heygen 5.0 不再局限于生成人物臉部近景及別的視頻,還可以捕捉完整的四肢動(dòng)作,并生成包含人物全身的 AI 視頻;
  3. 通義聽悟與 360AI 瀏覽器將文本及視頻轉(zhuǎn)文字功能已經(jīng)研發(fā)地相當(dāng)成熟,尤其是嵌入 AI 技術(shù)后,可以實(shí)現(xiàn)內(nèi)容總結(jié)、生成思維導(dǎo)圖、改寫潤色等原本需要耗費(fèi)較長時(shí)間的工作,幫助相關(guān)從業(yè)者提升效率,將精力更多地投入到創(chuàng)意生產(chǎn)中去。

以上就是本次 AIGC 測評的全部內(nèi)容了,希望能夠?yàn)橥瑢W(xué)們帶來一些啟發(fā)和新思路。如果本期的內(nèi)容大家還沒有看過癮的話,一定要繼續(xù)關(guān)注我們,我們會持續(xù)追蹤 AIGC 的最新進(jìn)展并在第一時(shí)間發(fā)布獨(dú)家深度測評,大家的關(guān)注和互動(dòng)會是我們持續(xù)更新的動(dòng)力。同學(xué)們,我們下期見!

收藏 32
點(diǎn)贊 25

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。