<acronym id="iyuci"></acronym>

大白(●—●) 邀你回答

2024/03/15

谷歌發(fā)布 VLOGGER 模型，可根據(jù)輸入圖片和音頻生成人物講話視頻！

谷歌發(fā)布的一個名為 VLOGGER 的項目。這個項目能夠根據(jù)輸入的圖片和音頻生成對應人物講話的視頻。但是個人感覺 VLOGGER 看起來沒有阿里巴巴發(fā)布的 DreamTalk 和 EMO 自然，大家覺得呢？

VLOGGER 主要特點：
1. 3D運動的擴散模型：它可以根據(jù)一張人物圖像生成由文本和音頻驅動的說話人視頻。
2. 創(chuàng)新的架構：項目包含一個創(chuàng)新的基于擴散的架構，通過時間和空間控制來增強文本到圖像模型的能力。
3. 高質量視頻生成：能夠生成高質量、可變長度的視頻，并通過人臉和身體的高級表示進行便捷控制。
4. 廣泛的適用性：與之前的工作相比，VLOGGER不需要為每個人單獨訓練模型，不依賴人臉檢測和裁剪，能生成完整的圖像（包括臉部和身體），適用于廣泛場景，如軀干可見或身份多樣化，這對于正確合成具有溝通能力的虛擬人至關重要。

項目地址：https://enriccorona.github.io/vlogger/

AI神器 AI視頻 Google VLOGGER 谷歌設計

收藏 關注話題 點贊 19

立即查看 AI神器的解決方案

3 秒搞定！7 款超好用的免費圖像去水印工具

AIGC AI神器閱讀 14.4w

查看詳情

優(yōu)設問答有問必答 ?? 回答問題贏獎品

6分鐘閱讀

8分鐘閱讀

12分鐘閱讀

6分鐘閱讀

8分鐘閱讀

{{comTitle}} {{comSubtitle}}

菜單 優(yōu)設網uisdc.com 優(yōu)設網 - 學設計上優(yōu)設

您還未登錄

登錄后即可體驗更多功能

大白(●—●) 邀你回答

立即查看 AI神器 的解決方案

AIGCAI神器閱讀 14.4w

Wo~本文的評論還空著，快來搶沙發(fā)

5.8k 設計師圍觀了該問題

為什么甲方總是指揮你做設計？快來看看你做對了沒有？

< 上一篇

邀你回答

宮崎駿《你想活出怎樣的人生》定檔4月3日，將會是宮崎駿的'告別之作'嗎？

下一篇 >

陳子木

陳子木

土撥鼠

夏花生

程遠

優(yōu)設讀報 2025年06月17日 星期二

騰訊宣布舉辦算法大賽，百萬獎金邀請全球人才

螞蟻集團聯(lián)手 inclusion AI ，推出開源多模態(tài)模型 Ming-Omni

字節(jié)跳動 Seaweed APT2 發(fā)布：實時互動 AI 視頻生成

微軟發(fā)布 700 個真實 AI 案例，探索智能化工作新模式

OpenAI Codex 全新升級，程序員編程新體驗

近期熱門問題

請在5秒內告訴我，你更喜歡哪個設計方案？

9位設計師參與回答

如果離職，公司的工作對接微信群你都是直接退的嗎？

8位設計師參與回答

30句很甜的，很浪漫的520文案，送給不善言辭的設計師~

6位設計師參與回答

如果現(xiàn)在讓你回到高考前，你會選什么專業(yè)？ ???

6位設計師參與回答

AI獨角獸崩塌，居然是一家全是人工，沒有智能的假AI公司？

5位設計師參與回答

各位設計師，有什么好的筆記本推薦給這位平面設計師么？

5位設計師參與回答

優(yōu)設官方微信群

添加管理員 招財

微信號: 掃碼添加

嚴格審核打造高質量交流群