国产中文字幕一区二区三区_青青久久av_久久精品国产99国产精品_欧美日韩国产亚洲一区

2024/03/15

谷歌發(fā)布 VLOGGER 模型,可根據(jù)輸入圖片和音頻生成人物講話視頻!

谷歌發(fā)布的一個名為 VLOGGER 的項目。這個項目能夠根據(jù)輸入的圖片和音頻生成對應人物講話的視頻。但是個人感覺 VLOGGER 看起來沒有阿里巴巴發(fā)布的 DreamTalk 和 EMO 自然,大家覺得呢?

VLOGGER 主要特點:
1. 3D運動的擴散模型:它可以根據(jù)一張人物圖像生成由文本和音頻驅動的說話人視頻。
2. 創(chuàng)新的架構:項目包含一個創(chuàng)新的基于擴散的架構,通過時間和空間控制來增強文本到圖像模型的能力。
3. 高質量視頻生成:能夠生成高質量、可變長度的視頻,并通過人臉和身體的高級表示進行便捷控制。
4. 廣泛的適用性:與之前的工作相比,VLOGGER不需要為每個人單獨訓練模型,不依賴人臉檢測和裁剪,能生成完整的圖像(包括臉部和身體),適用于廣泛場景,如軀干可見或身份多樣化,這對于正確合成具有溝通能力的虛擬人至關重要。

項目地址:https://enriccorona.github.io/vlogger/

收藏 關注話題 點贊 19 生成海報
優(yōu)設問答有問必答 ?? 回答問題贏獎品
{{ moreBtnTxt }}
閱讀相關文章
{{comTitle}} {{comSubtitle}}

谷歌發(fā)布 VLOGGER 模型,可根據(jù)輸入圖片和音頻生成人物講話視頻!

生成問答海報 我要提問 我來回答
主站蜘蛛池模板: 正安县| 基隆市| 沁水县| 长顺县| 新河县| 恩平市| 淳化县| 孝义市| 乐亭县| 富裕县| 茶陵县| 雷山县| 麻栗坡县| 元朗区| 哈密市| 锦州市| 威远县| 互助| 曲麻莱县| 柳江县| 莱阳市| 郎溪县| 白银市| 武胜县| 弥勒县| 吉林省| 巧家县| 阿克| 南溪县| 上蔡县| 和平县| 山丹县| 钟山县| 甘洛县| 康乐县| 阳东县| 临猗县| 日喀则市| 邵东县| 阿坝| 纳雍县|