大家還記得 Sora 是什么時候發布的嗎?2 月份,當時 OpenAI 發布之后,一夜之間就把 AI 視頻生成界攪得天翻地覆啊,但是現在一點消息都沒有了,反倒是其他平臺遍地開花,特別是這個月,簡直太爆炸了~
昨天深夜,Runway 放出醞釀了半年的全新版本 Gen-3 Alpha,也讓我們再次見證了這些巨頭的底蘊。
Runway Gen-3 Alpha 特點如下: 高保真視頻生成:能夠生成接近真實世界質量的視頻內容,具有高度的細節和清晰度。 精細動作控制:模型能夠精確控制視頻中對象的動作和過渡,實現復雜場景的流暢動畫。 逼真人物生成:特別擅長生成具有自然動作、表情和情感的逼真人類角色。 多模態輸入:支持文字轉視頻、圖像轉視頻、文字轉圖像等多種創作方式。 先進工具:支持運動畫筆、相機控制和導演模式等專業創作工具。 增強的安全措施:引入新的內部視覺審核系統和 C2PA 標準,確保內容的安全性和可靠性。 高質量訓練:使用高描述性的、時間密集的字幕進行訓練,使模型能夠理解和生成具有豐富時間動態的視頻。
現在還在內測中,后期可以體驗的時候再給大家分享地址!
暑期檔看什么?小編強烈安利博納影業抖音聯合出品的 AIGC 科幻短劇集《三星堆:未來啟示錄》
在博納 25 周年向新而生新聞發布會上,博納影業出品制作、抖音聯合出品的 AIGC 科幻短劇集《三星堆:未來啟示錄》正式亮相。該劇第一季共 12 集,作為抖音推出的首部 AIGC 科幻短劇集,預計上線今年的短劇暑期檔,在即夢 AI、博納影業 AIGMS、剪映的抖音官方賬號同步更新。即夢 AI 作為首席 AI 技術支持方,基于豆包大模型技術,為《三星堆:未來啟示錄》提供AI劇本創作、概念及分鏡設計、鏡頭畫面生成、圖像到視頻轉換、視頻編輯和媒體內容增強等十種 AI 技術。
喜歡 AI 視頻的小伙伴一定不要錯過啊!
斯坦福大學的研究團隊與 Apparate Labs 前幾天發布一款名為 Proteus 的創新 AI 視頻生成模型,可以從單一圖像生成笑、說唱、唱歌、眨眼、微笑、說話高度逼真和具有表現力的虛擬人物。 PROTEUS兼容多種大模型的多模態輸入,可以處理語音、文本和圖像等多種形式的數據。
Proteus模型亮點: - 高度逼真:利用先進的AI技術,Proteus能夠從單張圖片生成具有高度逼真表情和流暢動作的虛擬人物形象。 - 低延遲生成:Proteus模型具備低延遲特性,能夠實時響應語音輸入,生成每秒超過100幀的視頻流。 - 多模態交互:模型支持語音、文本和圖像等多種輸入形式,實現與用戶的自然直觀交互。
應用領域: Proteus模型在個性化虛擬助理、虛擬寵物、情感支持、客戶服務、教育和培訓、游戲定制、影視娛樂、市場營銷和社交媒體等領域具有廣泛的應用潛力。
申請體驗地址: https://apparate.ai/early-access.html
我們都知道 Stable Diffusion 3 是一款強大的文生圖模型,擁有20億參數,因其高效的推理速度和卓越的生成效果而備受矚目。
近日,Stability AI在推特上宣布正式開源了 Stable Diffusion 3 Medium(SD3-M) 權重,為廣大用戶帶來了免費試用的機會。而且官方還宣稱 SD3-M 是他們 Stable Diffusion 3 系列中最新、最先進的文本轉圖像 AI 模型!
Stable Diffusion 3 Medium(SD3-M)關鍵要點: 1. Stable Diffusion 3 Medium,由 Stability AI 推出,代表了我們迄今為止在文本到圖像領域最前沿的開放模型技術。 2. 這款模型設計緊湊,便于在常見的個人電腦、筆記本電腦,以及企業級圖形處理單元(GPU)上高效運行。其優化的大小使其成為文本轉圖像應用的新一代標準。 3. 現在,這些精心調整的模型權重可以在非商業性的開放許可證和面向創作者的低成本許可證下供您使用。如果您有大規模商業應用的需求,歡迎聯系我們以獲取更詳細的許可信息。 4. 想要體驗 Stable Diffusion 3 模型的魅力,您可以通過 Stability AI 的平臺 API 來嘗試。我們還提供在 Stable Assistant 上注冊即可享受的三天免費試用。此外,您還可以通過 Discord 加入 Stable Artisan,進一步探索模型的潛力。
Stability AI官方公告 地址:http://stability.ai/news/stable-diffusion-3-medium
設計師新寵來啦!初創公司 Luma 全新發布 Dream Machine,能從文本/圖像直接生成視頻。感覺比 Sora 也差不了多少。
Dream Machine 120秒就能給你做出一個120幀的視頻!這速度,想改點啥,馬上就能再做一個新的,太高效了!而且鏡頭效果超自然,Dream Machine還超級懂鏡頭語言!它能模擬出各種電影級的攝像機運動,讓你的視頻看起來就像大片一樣流暢、自然。
大家可以看看下面的演示視頻,它還能理解人和物是怎么在現實中互動的,所以做出來的視頻里,角色和場景都超級真實,一點都不會覺得假。
最最最主要的是,現在人人都可以免費體驗!服務器都快被大家擠爆了,你還在等啥呢?趕緊來試試吧!
體驗地址:https://lumalabs.ai/dream-machine
近日,快手發布了國內首個效果對標 Sora 的視頻生成大模型「可靈」,并已在其旗下的快影App中開放邀測體驗。
可靈大模型是由快手 AI 團隊自研,采用了類似 Sora 的技術路線,并結合了多項自研創新技術。該模型具備強大的概念組合能力和想象力,能夠生成具有大幅度合理運動的視頻,并模擬物理世界特性。其生成的視頻分辨率高達1080p,時長最高可達2分鐘(幀率30fps),且支持自由的寬高比。
可靈大模型不僅限于文生視頻功能,還將推出其他應用,如“AI舞王”和“AI唱跳”,這些應用可以驅動表情和肢體動作,僅需一張照片就能生成相應的視頻。
目前,可靈大模型已在快影App中正式開啟邀測,支持720p視頻生成,豎版視頻生成能力也即將開放,大家可以來試一試,看看生產的效果怎么樣!
官網地址:https://kling.kuaishou.com/
給大家分享一個超好用的短視頻制作 AI 神器:GlatoAI。特別適合那些想快速給產品做介紹的自媒體小伙伴們,還有想第一時間get新產品信息的商務大哥大姐們。
你只需把鏈接往上一貼,不管是文章、產品頁還是啥網頁鏈接,GlatoAI 都能秒速分析,然后給你做個配套的短視頻廣告。視頻里啥都有,包含講話的人物+語音+字幕。
就這么簡單,不需要你費太多腦筋。趕緊試試吧,真的超好用哦!
如果對效果不滿意,還可以在以下方面進行更多的調整: 1. 修改名稱、上傳標志、產品描述、期望持續的時間、額外的介紹信息 2. 除了自動收集鏈接中的圖文視頻之外,也可以選擇自行上傳更多信息 3. 從多個備選的視頻腳本中進行篩選 4. 更改不同的數字人形象(性別、年齡、拍攝背景等等)
官網地址:GlatoAI
騰訊發布了 ToonCrafter,是一種新型的卡通動畫生成技術,可以通過生成插值方法生成自然、連貫的卡通動畫中間幀。該技術超越了傳統基于對應關系的卡通視頻插值方法,能夠處理復雜的非線性運動和遮擋問題,使動畫過渡更加平滑自然。
從演示來看效果很好,過渡很順滑,而且沒有明顯問題。ToonCrafter 利用預訓練的圖像到視頻模型,可以插值兩幅卡通圖像,并根據參考圖像對動畫草圖自動上色。它支持生成最多16幀的視頻,每幀分辨率為512x320。通過減少DDIM步驟,可以降低推理時間。
還設計了一個靈活的草圖編碼器,使用戶能夠對插值結果進行互動控制。
項目地址:ToonCrafter
就在剛剛,著名生成式 AI 音樂平臺 Elevenlabs 在官網發布了全新功能,文本可直接生成各種逼真音樂特效。
這項技術對于電影、游戲、短視頻等行業非常有幫助,因為它可以簡化尋找音效的過程,并且多數音效已經獲得了 Shutterstock 的商業授權。
Elevenlabs 的這個新功能允許用戶通過描述來生成音效,例如汽車呼嘯而過的聲音、刀劍碰撞的低沉聲音或小提琴劃過空氣的尖銳聲音。用戶可以登錄 Elevenlabs 的官網,選擇 “Sound Effects” 并使用該功能。在生成音效之前,用戶可以設置音效的時長和文本提示的還原程度。Elevenlabs 還提供了一些示例音效,如雷雨天氣的聲音和模仿獸人聲音的搖滾音樂。
Elevenlabs還提供了語音克隆和文本轉語音的功能,但目前對中文的支持較差,生成英文的效果則非常棒。
現在所有用戶都可以免費試用 Elevenlabs 的這個新功能。大家可以訪問 Elevenlabs 官網了解更多詳情。
今天我要推薦的網站,能為你提供未來感十足的AI網站生成體驗!
Framer 由Koen Bok和Jorn van Dijk于2014年創立。他們曾在Facebook和Hype進行產品設計和開發,看到現有設計工具無法滿足創建復雜互動原型的需求,于是創立了Framer。當下,Framer已經成為設計和開發領域的重要工具。
雖然在實時協作和矢量設計方面,Figma等競爭對手更具優勢,但Framer憑借其在互動原型和動畫方面的強大功能,保持了在設計工具市場中的重要地位。
? Framer亮點 ? ① 無代碼設計:你無需編程基礎,通過拖放組件即可創建復雜的交互效果。 ② 實時協作:多人同時編輯和評論,團隊合作更加高效流暢。 ③ 自動化設計:智能布局和響應式設計功能,讓你的作品在任何設備上都完美呈現。這也是最打動我的一點。現在大大小小的設備太多了,能做到多端適配,簡直感動到哭。 ④ 豐富的模板和組件:海量模板和UI組件庫,助你快速啟動項目,節省時間。 ⑤ 高保真原型:從靜態設計到動態原型,一氣呵成,完美展示用戶體驗。
官網地址:Framer
昨天(5月30日)凌晨,OpenAI 在 x 平臺宣布,GPT-4o 多模態能力向所有用戶免費開放。不過,在使用次數上官方沒有更新公告,預計還是會是有一定次數限制。
北京時間 5 月 14 日凌晨,OpenAI 舉辦發布會,帶來了 GPT-4o 。該模型打通了文本、圖片、視頻和語音輸入,無需中間轉換,互相之間就可以直接生成。此次發布會還帶來了更智能的實時語音助手,以及適用于 macOS 的 ChatGPT 桌面應用程序。
當時,OpenAI 宣布向 ChatGPT Plus 和 Team 用戶推出 GPT-4o,很快就會向企業用戶推出。同時,也向所有人開放 GPT-4o 多模態能力,但有使用次數限制。
隨著今年WWDC的臨近,記者 Gurman 在其最新一期《Power On》專欄中,為我們揭秘了蘋果在人工智能領域的最新進展。蘋果將對其智能助手Siri進行升級,新版本的Siri將依托于蘋果自主研發的LLM技術,為用戶提供更為智能的服務。
除此之外,蘋果還將在多個方面引入AI技術以增強用戶體驗,例如通過AI技術實現語音備忘錄的自動轉錄、照片的智能修飾,以及Spotlight和Safari搜索功能的優化。而且,AI還將能夠根據用戶的短信內容,動態生成個性化的表情符號。
在個性化界面方面,蘋果也做出了創新。用戶將能夠擺脫網格的限制,自由地在屏幕上擺放圖標,并可以自定義圖標的顏色,這一改進雖與AI無直接關系,但無疑將極大地提升用戶體驗。
同時,有消息稱蘋果將在即將到來的 iOS 18 和 macOS 15 系統中,為 Safari 瀏覽器加入一系列人工智能支持的新功能。
1、智能搜索。 蘋果可能在搜索中引入 Ajax 語言模型來提供文本摘要。
2、Web橡皮擦:這一功能強調用戶界面的簡化和隱私保護的增強,允許用戶自定義網頁內容,刪除不需要的元素,如廣告和圖片。
3、用戶界面更新:蘋果正在將 Safari 的關鍵工具集中到一個位置,以提高用戶的訪問效率。
4、 AI增強的視覺查找:蘋果可能在2025年推出高級視覺搜索功能,允許用戶通過圖像獲取信息,類似于 Siri 目前識別照片中的植物、寵物和地標的功能。
這些新功能的加入,將使Safari瀏覽器的使用體驗更上一層樓,你覺得哪項最實用呢?