這兩天,在 X 上看到一個很酷的 2D 動漫 AI 視頻。
我直接放一下,強烈建議看完。
當時第一遍看的時候,不知道為什么,心里的二次元之火熊熊燃燒。
我也一直都是那個,熱愛紙片人的少年。
片子在動漫畫風的穩定性上,強的可怕。
這個作者,是一個非常喜歡做 AI 視頻,而且是動漫風格 AI 視頻的創作者,叫 Naegiko。
雖然片子只有 10 萬播放,但是,很多大號都直接轉載他的,總播放量破百萬肯定是有的了。
這個 AI 視頻的工具,來自 Vidu。
在評論區的下面,哥們也在給所有喜歡做動漫風格的人,安利 Vidu。
又是 Vidu。
其實很多人上周也在催我寫 Vidu1.5 版本的更新,但是事情實在太多,本來上周五打算發,結果出了點小毛病一波直接干到醫院,一拖也就拖到了今天。
其實坦率的講,現在的視頻大模型,在寫實上效果都能卷的還不錯,但是在一些風格化的動漫視頻上,經常會出現一些變形和識別錯誤。
甚至有的還會把你給的動漫的參考圖,直接給你在過程中變成寫實或者那種 3D 風格的,穩定性很差。
而對于 Vidu 來說,在我測試的這幾個月里,Vidu 的 2D 風格,就是現在最強的,也是他們之前,最大的特色。
但是 Vidu1.5 的這波更新,如果只是模型質量提高了一些,語義理解強了一些,其實坦率的講也沒什么好寫的了,大家對 AI 視頻模型的更新已經有點趨近于去年語言大模型的感覺了,已經有點免疫了。
需要一些更直觀的功能,才能讓大家感覺到,很酷的感覺。
而 Vidu1.5 版本這次的更新,剛好就有一個我覺得劃時代的新功能,叫:
我先放兩個視頻,讓大家先直觀感受一下,這個東西是個啥。
衣服是梅西的 10 號球服,轉過身來,是宋小寶,然后振臂高呼。
來自朋友@卡爾之前做的一個 case,馬斯克和甄嬛漫步在故宮中,還動態非常大的給屏幕面前比了個大拇指。
現在應該能模糊的感覺到了一些,來自多主體一致性的強大了吧?
用最簡單的話解釋,就是你可以傳至多 3 張圖。來實現任意人物、任意物品、任意場景的一致性。
比如梅西那個 case,就是上傳了梅西的球服+宋小寶的臉,然后用一段 Prompt:梅西背對著鏡頭,慢慢轉過頭是圖中的男子在沖著鏡頭笑。直接生成的。
而馬斯克和甄嬛,則是上傳了一張馬斯克的、一張甄嬛的、一張故宮的圖。然后用一段 Promtp:一個穿著黑色衣服褲子的男人和一個穿著黃色中國古代服裝的女人走在宮殿外的路上。
就出來了完美一致的視頻。
這就是 Vidu1.5 這波更新、最酷的功能,多主體一致性。
在我看來,可能是現在很多人意識不到,但是在 AI 視頻領域,可能劃時代的一個技術。
我們常說 AI 視頻想進入專業影視領域,除了最終質量之外,一直以來都有三個一致性要解決:
風格一致性、角色一致性、場景一致性。
如果連在單個片段里,這三個一致性都沒法解決的話,那別提電影這種最高殿堂的產物了,連一些劇集都夠嗆。
而過往,風格一致性已經解決的還行了,角色一致性 Vidu 在今年 7 月份的更新中其實上了一版,而場景一致性,一直以來幾乎沒有任何解決方案。
這一波,Vidu1.5 直接用最簡單開箱即用的方式。
解決了所有單片段中的一致性。
很強,非常強。
你終于可以不用擔心,你的廣告、你的片子中,人物角色形象不一致的問題了,也不用去用那個蹩腳的 Midjourney 出圖再圖生視頻的流程了,而是直接找到你想要的,扔進去,加一段 prompt,完事。
這個影響,可能非常深遠,更是一道,黎明的曙光。
Vidu 網址在此: www.vidu.studio
進去登錄以后,就能看到這個參考生視頻了,打開那個多主體一致性功能,你就可以傳最多三張圖片作為參考。
比如,我們傳一個奶龍和一個雞哥上去,讓他兩,來一波開心的跳躍。
Vidu1.5 的速度也非常的快,我選的 720P,不到 1 分鐘,就跑出來了,速度上跟 Runway 是一個級別的了。
效果也是非常的魔性。
我能對著他兩跳看一個小時。
雞哥和奶龍,在主體上,幾乎是跟我傳上去的圖片,一摸一樣,完美的實現了一致性。
你可以用這三個圖片格子,來自由組合,來實現任意人物、任意物品、任意場景的一致性。
這個事情非常的好玩。
比如上面奶龍和雞哥的就是,人物正面+人物正面。
你也可以傳一張人物背面+人物正面。
比如還是宋小寶。
人物臉可以傳兩張,更強的保證人臉的一致性。
Prompt 寫:女生轉過身發現臉是該男子。
對不起了宋小寶老師。。。。。
還可以是一個人物的三視圖,直接實現 3D 人物級別的一致性,3 張圖,就可以直接跳過建模階段直接出成片。
我隨手拍了我非常喜歡的 Dimoo,之前的熊貓款的三視圖。然后扔到 Vidu 里。
然后不到 1 分鐘,一段 Dimoo 在森林里的視頻就做完了。
穩定的要死,以后這種片子,誰還建模渲染啊。。。
你也可以,人物+物品。
比如一個女人喝一口可口可樂。
向偉大的 AI 致敬。
甚至,Vidu1.5 的多主體一致性不僅對角色是一場革命,對電商廣告也是。
直接物品+場景,以后還渲染個屁啊。
比如 APPLE watch。
我讓他在這個場景里面來個 360 度旋轉。
這個多主體一致性,絕對是我最近見過,可能是 AI 視頻領域,最有趣也是最有用的功能之一。
想起來很多年以前,羅子雄在 TED 上做的一個演講。
講的就是創意。
創意其實很多時候就是借鑒和組合的能力。
比如把這些元素,隨機組合。
就會得到很多很多有的東西。
而 Vidu1.5 這個多主體一致性,其實也是組合,你可以不斷的組合。
人物背面+人物正面、人物三視圖、物體+場景、人物+場景、人物+物體等等等等。
太多了。
甚至你如果覺得三張圖片不夠用,還可以上傳的時候,將多個主體拼接到一張圖中上傳,展開無限可能。
新的技術,總是能進一步推升我們的邊界,讓我們的想象力,終于可以更為宏遠的延伸。
感謝 Vidu,感謝這個多主體一致性。
我覺得,我又可以,繼續造夢了。
國產的 AI 視頻,也真的是越來越好了。
Vidu、可靈、海螺、即夢、pixverse,每一個都在市場上,殺出了自己的一條血路。
為你們,獻上我最崇高的敬意。
以及,最好的祝愿。
歡迎關注作者的微信公眾號:數字生命卡茲克
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
熱評 乏味的雨天