大家好,我是言川。
Google 在上周還整了個大活:在 I/O 大會上正式發布了全新的視頻生成模型——Veo 3。說實話,當我第一次看到它的演示視頻時,腦子里冒出來的第一個詞就是:離譜。
過去我們印象中的 AI 生成視頻,頂多也就是“動圖級別”的尷尬拼貼,沒聲音、沒氛圍、沒情緒,像個木偶劇。
而現在,Veo 3 直接把這套標準打碎重建。現在你看到的,不再是冰冷的片段,而是真正“會說話”“有情緒”的擬人級視頻生成。
我直接放幾個案例,大家感受下:
一位游戲主播在直播《堡壘之夜》,視頻中的人物情緒、表情、手勢,全是 AI 一次生成的。
作者@Matt Shumer
甚至連游戲操作畫面,Veo 3 都能“憑空捏造”。
作者@Matt Shumer
你能想象古希臘的畢達哥拉斯,親口講解他的定理嗎?AI 讓他“復活”了。
作者@Pietro Schirano
一只大猩猩對你說“我要檢查你的早餐”……離譜,但好笑。
作者@MattVidPro Al
一個街頭采訪視頻,完全由 AI 生成——我第一次看的時候,真的沒看出來,這竟然不是實拍。
作者@Min choi
最后這個,堪稱“AI 致敬好萊塢”:一段充滿電影質感的動作鏡頭,如果不是我刷過好幾遍《頭號玩家》,我真不會懷疑這居然是模型生成的。
作者@Rishi
沒錯,以上這些令人頭皮發麻的片段,全部都出自 Google 最新的視頻生成模型:Veo 3。
更多案例:
那么本篇文章,我將帶大家深入了解 Veo 3 的使用方式。同時,在文章結尾,我也會手把手教你:如何使用 AI 撰寫視頻生成提示詞,幫你提升提示詞質量,打造更符合預期的視頻內容。
目前,在 Google 現有的產品矩陣中,支持 Veo 3 模型的路徑有兩個,分別是:Google Flow 和 Google Gemini,我們先從 Flow 開講:
1. 產品介紹
簡單說,Google Flow 是一款全新的 AI 視頻創作工具。你只需要輸入一句話,或者上傳一張圖片,它就能自動生成一段具有電影質感的視頻片段,甚至還內置了視頻編輯能力。
Flow 工具背后的三大核心引擎,分別是 Veo 3 視頻模型、Imagen 4 圖像模型以及 Gemini 2.5 系列模型。
而這些模型也就是 Google 上周在 I/O 大會上同步亮相的全新模型,用一句話概括 Flow 的定位:“一句話 / 一張圖,出一部短片”。
Flow 官方地址在這: https://labs.google/flow/about
但要注意兩個使用門檻:
- 登錄地區必須是美國(其他地區基本打不開)。
- 需要訂閱 Google AI Pro 或 Ultra 套餐,才能解鎖最新的 Veo 3 模型。
第一個門檻大家自行解決。我教大家如何白嫖 Pro 訂閱計劃,兩種方式:
① 首月免費使用,前提是你需要一張海外支付卡(如美區虛擬卡),可隨時取消訂閱,地址: https://one.google.com/about/google-ai-plans/
② 申請學生免費計劃,最長可獲得 15 個月免費 Pro 會員,這個你們可以自己想辦法申請,地址在這: https://gemini.google/students/
我自己測試用的是第一種:首月免費試用 Pro 會員,開完會員后系統會贈送 1000 積分,Veo 3 視頻模型生成所消耗的積分是 100,也就是說,最多可生成 10 個視頻。
2. 使用說明
模型設置
首先是模型設置的部分。目前 Flow 一共提供了三檔模型選項:Fast、Quality、Highest Quality。
其中,前兩者其實用的是上一代的 Veo 2 模型,而真正支持音頻生成 + 情緒細節控制的,是第三個選項:Highest Quality,也就是最新的 Veo 3 模型。
生成模式
Flow 目前支持三種生成模式,分別是:文本到視頻、幀轉視頻和素材轉視頻。
文本到視頻:這個是最推薦也最主流的用法。只需要輸入一句話或一段描述文字,Flow 就能直接生成一段 8 秒左右的視頻。
提示詞:olympic skateboarder being interviewed by a reporter with a gold medal hanging around her neck. the reporter asks "and what are you doing next?" the skateboarder says "I'm going to sell enterprise software in SF!"
Veo 3 的指令遵循度非常高,視頻中的角色對話完全按提示詞來,甚至連口型都跟語音高度同步。
作者@Justine Moore
幀轉視頻:上傳 1~2 張圖片,Flow 可以基于圖像內容生成中間幀視頻,實現首尾幀的效果。目前首尾幀功能只支持 Veo 2 模型。
該模式支持預設鏡頭運動軌跡,讓你控制畫面如何過渡,但依舊只有 Veo 2 模型可用。
提示詞:Astronauts leave the museum across the bridge.
素材轉視頻:這個模式主打“風格遷移”和“視頻延展”,你可以上傳多張圖像,Flow 會自動補齊缺失的畫面邏輯,甚至做風格重建。
但該功能目前僅對 Ultra 會員 開放。
提示詞:a woman that has a transparent glass torso containing reddish-orange lava-like blobs rides in the back of a cab.
視頻編輯
最后,就是 Flow 的 Scene Builder 功能。它就像是拼故事的時間軸,讓你把多個短視頻片段像拼圖一樣組裝成一個連貫、有情節的完整影片。你可以在 Flow 的頂部找到它。
或者是,在生成視頻后,點擊“Add to scene”功能,快速將該視頻加入到“Scene Builder”中。
加入進來后,你就可以對該視頻片段進行后續的編輯修改了。
在編輯視頻片段時,有兩個功能:Jump to 和 Extend。
Jump to:將選定片段的后面部分重新生成,比如讓這個女孩下車后跑向森林。
提示詞:She runs through the forest.
Extend:將所選視頻片段延長,比如女孩到家參加街上的慶祝活動。
提示詞:She arrives home to a celebration in the street
完成多個片段后,使用“Arrange”功能,可以重新調整各個視頻段落的順序
最后,一鍵導出即可。但為啥這個視頻沒有配音呢,其原因在于目前 Flow 的視頻編輯功能,僅支持 Veo 2 模型編輯生成。
總結一下,Flow 和以往的 AI 視頻工具有本質上的不同,它不僅能生成高質量視頻,還能對視頻進行結構化編輯。
背靠 Veo 3 的多模態能力,Flow 不僅可以生成“有聲音、有情緒、有互動”的視頻片段,還能借助 Scene Builder 保持角色一致性、逐幀疊加修改,實現真正意義上的“一站式 AI 視頻創作”。
除了 Flow,Veo 3 現在也已經集成進了 Google 自家的多模態對話平臺——Gemini。
你可以像平時聊天一樣,在對話框中直接輸入提示詞,通過 Gemini 的“視頻”功能,就能一鍵生成視頻內容。
地址在這: https://gemini.google.com
目前,Gemini Pro 用戶享有 10 次免費生成配額,生成 Veo 3 視頻不會消耗積分。想白嫖的朋友,可以回顧上文提到的 Pro 會員開通方式~
我們來看一個實際案例,直接在對話框中輸入提示詞:
提示詞:A beautiful young woman ASMR creator, sitting in a cozy, softly lit room. She types on a noisy mechanical keyboard, then looks up with a playful smile and gently blows into the microphone. As she whispers sweetly into the mic, she says, "Brother Yanchuan is really so handsome!"
翻譯成中文:一位年輕漂亮的 ASMR 創作者坐在一間溫馨、燈光柔和的房間里。她敲擊著發出咔嗒聲的機械鍵盤,然后抬頭露出俏皮的笑容,輕輕地對著麥克風吹氣。她輕聲細語地對著麥克風說:“言川哥哥真的好帥!”
在使用 Veo 3 模型生成視頻時,你是可以指定視頻中人物說話的內容,比如“言川哥哥真的好帥!”
ASMR!!!我酥了......來聽聽這段視頻:
接下來,是大家呼聲最高的部分:怎么寫 Veo 3 的視頻提示詞?
我們先來拆解一套標準的提示詞結構:
提示詞核心構成要素:
- 主體 : 視頻中主要的對象、人物、動物或場景。
- 動作 : 主體正在做什么。這是視頻的核心動態。
- 背景/環境 :視頻發生的地點和周圍環境。
- 風格:視頻的視覺美學或藝術風格。這可以是通用的,也可以非常具體。
- 運鏡:攝像機如何移動以及鏡頭如何構圖。這能極大地影響視頻的氛圍和敘事。
- 氛圍/光線:視頻的整體情緒、色調和光照條件。
- 音頻:Veo 3 支持音頻生成,包括環境音效、背景噪音甚至對話。請明確指定你想要的音頻。
申明:這只是一套提示詞結構規范,你也可以挑選部分要點進行組合描述,甚至是只有一句話也能生成高質量的視頻,畢竟 Veo 3 模型對語義的理解非常強。但如果你想更準確的控制 AI 生成,那么提示詞越詳細越好。
當提示詞結構出來后,可能你還是不知道如何去描述你想要的畫面,或者是覺得太麻煩了。那么我推薦你使用大語言模型來生成提示詞,而你只需要提供幾個核心的關鍵詞即可。
指令模板如下,【】中的內容,就是你可以修改的主題關鍵詞。
我需要使用 Google 的 Veo 3 模型生成一段【電影級別的槍戰】視頻,請按照我給你提供的提示詞結構,幫我提供完整的視頻提示詞。
提示詞結構:
- 主體 : 視頻中主要的對象、人物、動物或場景。
- 動作 : 主體正在做什么。這是視頻的核心動態。
- 背景/環境 :視頻發生的地點和周圍環境。
- 風格:視頻的視覺美學或藝術風格。這可以是通用的,也可以非常具體。
- 運鏡:攝像機如何移動以及鏡頭如何構圖。這能極大地影響視頻的氛圍和敘事。
- 氛圍/光線:視頻的整體情緒、色調和光照條件。
- 音頻:Veo 3 支持音頻生成,包括環境音效、背景噪音甚至對話。請明確指定你想要的音頻。
注意以下幾點:、
- 最后輸出的結果需要是一整段不帶分類標簽(如主體、動作等)的提示詞。
- 分別提供中英文兩套提示詞。
你可以使用 ChatGPT、Gemini、Deepseek 等 AI 聊天工具,但建議你將“搜索”功能開啟,這樣的話,AI 可以根據你提供的主題關鍵詞,自動檢索相關的資料信息,寫出的提示詞效果會更好。
你可能會問:為什么還要寫一份中文提示詞?
原因很簡單:目前 Flow 只支持英文輸入,但中文提示詞更方便像我這種英語苦手先理解畫面,再翻譯確認~所以,中英雙份提示詞 = 更高效率 + 更低試錯成本。
戰爭片場景--提示詞:On a war-torn urban street, two special forces soldiers in tactical gear engage in an intense firefight amidst the rubble, bullets whizzing through the air, sparks flying, and deafening explosions. The street is lined with burning vehicles and collapsed buildings, with thick smoke billowing and flames lighting up the night sky. The scene adopts a cinematic action movie style, with rapid cuts capturing the soldiers' tense expressions and swift movements. The camera employs handheld tracking, weaving through the combat scene to create an immersive sense of urgency. The overall color tone is cool, highlighting the brutality and tension of the battlefield, with lighting primarily from explosions and muzzle flashes. Audio includes intense gunfire, explosions, soldiers' shouts, and background sirens, enhancing the realism and urgency of the scene.
生成的效果有點尷尬,這三個人不知道在干嘛......
換個主題,你可以繼續對 AI 下達指令:
對話指令:換個主題案例,脫口秀演員
脫口秀俱樂部--提示詞:In a dimly lit comedy club, a casually dressed stand-up comedian stands center stage, holding a microphone and smiling as they share humorous anecdotes from everyday life, eliciting bursts of laughter from the audience. The background features red velvet curtains, with spotlights hanging above the stage, creating a warm and intimate atmosphere. The camera uses medium shots, occasionally cutting to audience reactions, capturing their laughter and applause. The overall style is documentary-like, with warm tones and soft lighting, emphasizing the authenticity of the live performance. Audio includes the comedian's clear voice, audience laughter, and occasional clapping, enhancing the ambiance of a live show.
好了,以上就是本次提示詞撰寫的全部內容。前段時間就有不少寶子私信催我更新,這次借著 Flow 的上線,我特地圍繞 Veo 3 做了一個完整提示詞教學,希望能幫你在生成視頻時少走彎路、少燒積分。
最后我們再來欣賞幾個視頻案例:
提示詞:Two men filming in a podcast studio. First man says "We did it—my grandma could start a podcast now."The second man responds "Should I call her for content ideas?"
提示詞:A 50mm cinematic medium shot of a Latina business woman in her 30s, standing on a staircase in a Hogwarts library at night. Her arms are wide, eyes closed, as a glowing vortex of books swirls around her. Her medium-length dark hair blows in an electric wind, with golden motes of light connecting the flying books in a storm of knowledge. The setting is a magical, golden Hogwarts library. Cinematic, dramatic lighting.
提示詞:A short video scene of two muffins baking in an oven. The camera is inside the oven, cinematic close-up with soft golden lighting. Steam rises slightly as the muffins rise in the heat.First muffin: "I can't believe this Veo 3 thing can do dialogue now!"Second muffin: "AAAAH, a talking muffin!"The scene should be comedic and surreal, with subtle facial expressions on the muffins to convey surprise and confusion.
提示詞:A college professor doing a class on Gen Z slang and the video pans over to all the boomers taking notes and seeming super interested.
好了,這就是我這次對 Veo 3 的完整體驗分享。
寫到這里,其實我腦子里只有一個感受:AI 正在把“創作”這件事,變成一件越來越輕的事情,但對創作者的要求,其實變得越來越重。
輕,是因為門檻真的降低了:你不需要懂拍攝,不需要懂剪輯,也不需要后期調色,你只要輸入一句話,就能得到一段“像模像樣”的電影級短片。
重,是因為“那句話”該怎么寫,成了新的壁壘——提示詞寫得清不清楚?邏輯順不順?細節有沒有落下?這些決定了 AI 能不能聽懂你。
而這,也正是我們未來創作力的分水嶺。
AI 不會取代誰,但它確實正在逼著每個人“表達得更準確、思考得更具體”。
所以,別把它當成靈感的終點,而是把它當成表達的放大器:你說得越清楚,它就做得越極致。
而你要做的,就是成為那個能讓 AI 明白你想法的人。
如果你想學習 AIGC,可以加入我主理的《優設 AI 俱樂部》,俱樂部內沉淀有 2000+ 優質 AI 學習資料,涵蓋 AI 繪畫、AI 視頻、AI 提示詞、AI 工具庫、AI 商業設計案例、研究報告......
也可以點擊鏈接: https://wx.zsxq.com/group/15288828142182
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 7 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓