微軟推出了一項名為Mora的視頻生成項目,該項目利用先進的Agents技術來嘗試復原Sora的視頻生成能力。目前,Mora已經能夠基本還原Sora的所有功能,并可以生成分辨率為1024*576的12秒視頻。
這些復原的能力包括:將文本直接轉換為視頻、根據特定的文本條件將圖片轉換成視頻、擴展已有的視頻內容、實現視頻到視頻的編輯、串聯多個視頻片段,以及模擬數字世界等。
項目簡介:原文鏈接
Mora項目基于一種新型的多AI智能體框架,融合了多個尖端的視覺AI智能體,旨在復刻Sora所展示的強大的通用視頻生成能力。Mora能夠靈活運用這些視覺智能體,在各種任務中成功地模仿了Sora的視頻生成技巧。
通過廣泛的實驗驗證,我們發現Mora在這些任務上的表現已經與Sora相當接近。從整體性能上評估,Mora與Sora之間仍然存在一些差距。但是,我們仍對Mora項目寄予厚望,希望它能夠引領未來視頻生成技術的發展方向,并通過多AI智能體的協同工作實現更多的突破。