熱評(píng) 酷酷的阿金

此處應(yīng)有掌聲??

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

Google 也不知道受了什么刺激,最近在 AI 場(chǎng)上,好像越來(lái)越有站起來(lái)的意思了。

之前我就寫(xiě)過(guò) Gemini 2.5 pro,是在聊天記錄可視化的文章里。

全世界,只有 Gemini 2.5 pro,能吃下一個(gè)每天 999+微信群聊天記錄的上下文,同時(shí)還能給你干出,一個(gè)還挺好看的可視化網(wǎng)頁(yè)。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

在 Qwen3 的跑分中,也印證了,Gemini 2.5 Pro 的能力也是真的強(qiáng)。

而我自己在是日常使用中,也幾乎是把 Gemini 2.5 Pro,變成了我的默認(rèn)編程模型。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

但是昨晚,Google 好死不死的,又把模型更新了一版,把版本號(hào)變成了,Gemini 2.5 Pro(I/O 版)。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

而在后臺(tái)的模型調(diào)用里,命名是 Gemini 2.5 Pro Preview 05-06。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

現(xiàn)在在 Gemini 自己的產(chǎn)品官網(wǎng)上,雖然看著還是原來(lái)的 2.5 Pro (experimental),但其實(shí)背后的模型已經(jīng)變成 Gemini 2.5 Pro Preview 05-06 了。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

有一說(shuō)一,Google 你的命名到底能不能統(tǒng)一一下。

真的好亂。。。

而且,Google 是真的感覺(jué)等不及了,其實(shí)距離他們一年一度的 I/O 大會(huì),也就不到兩周時(shí)間了,但是還是選擇了把新模型直接放出來(lái)。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

這種行為,一般要么是真牛逼,要么是來(lái)吹牛逼。

但是 Google,這回是前者,是真的有點(diǎn)牛逼。

他們自己也說(shuō)了:

We were going to release this update at Google I/O in a couple weeks, but based on the overwhelming enthusiasm for this model, we wanted to get it in your hands sooner so people can start building.

不是我來(lái)營(yíng)銷,是真的人民群眾需要啊,我只是順勢(shì)而為。

這次 Gemini 2.5 Pro 05-06 版本(后面就簡(jiǎn)稱 05-06 版了),跟今年三月 DeepSeek V3 03-24 的更新很像。都是完全為了代碼服務(wù)的,把代碼能力,往上提升了一個(gè)巨大的優(yōu)先級(jí)。

而這次的 05-06 版,我覺(jué)得有兩個(gè)亮點(diǎn):

  1. 模型代碼能力在盲測(cè)競(jìng)技場(chǎng)登頂,力壓 Claude 3.7 Sonnet。
  2. 得益于 2.5 Pro 強(qiáng)大的多模態(tài)能力,這次不僅可以給參考圖生成代碼,還可以,給參考視頻生成代碼。

特別是第二點(diǎn),目前應(yīng)該是全球唯一。

先看看代碼能力的跑分。

這次最核心的榜單,就是,WebDev Arena。

網(wǎng)址:https://web.lmarena.ai/leaderboard

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

0506 版直接腳踩 Claude 3.7 Sonnet,勇得第一。

可能很多人不知道 WebDev Arena 是啥,我稍微解釋一下,這玩意,還是挺有含金量的。

LMArena,最著名的大模型盲測(cè)競(jìng)技場(chǎng),我相信一直關(guān)注 AI 的,大多數(shù)人都或多或少的聽(tīng)過(guò)。

跟一些傳統(tǒng)的測(cè)試集不一樣,這玩意就是純粹的盲測(cè),用戶提出一個(gè) Prompt,然后 LMArena 直接給你兩個(gè)你也不知道是什么模型生成的回答,讓你選你覺(jué)得哪個(gè)好。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

所以,在這上面,你幾乎就做不了弊,全靠普通用戶,一票一票投出來(lái)的,就跟拆盲盒一樣。

而 WebDev Arena,其實(shí)就是一個(gè)子榜,還是由 LMArena 他們開(kāi)發(fā)的,專為評(píng)測(cè)網(wǎng)頁(yè)前端開(kāi)發(fā)任務(wù)(比如 HTML、CSS 和 JavaScript)而設(shè)立的。

玩法跟 LMArena 一樣,也是用戶盲測(cè)二選一。

唯一不同的是,WebDev Arena 會(huì)生成代碼的預(yù)覽給你看,而不只是文字了。

比如我讓他生成一個(gè) Web 的像素貓小游戲。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

在等了一分鐘兩邊全部生成完之后,你就能非常明確的看出來(lái),兩邊哪個(gè)是垃圾。。。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

傻子都能看出來(lái),右邊爆殺左邊,這個(gè)時(shí)候,你就為右邊,投出神圣的一票就行。

然后呢,他們用 Bradley-Terry(BT)模型,成對(duì)對(duì)決中的勝負(fù)數(shù)據(jù),來(lái)估算模型的強(qiáng)度,為每個(gè)模型計(jì)算一個(gè)分?jǐn)?shù),這個(gè)分?jǐn)?shù)反映此模型相對(duì)于其他模型的獲勝概率。

這個(gè)排名系統(tǒng)非常類似于國(guó)際象棋和 LOL、王者榮耀里中常用的 Elo 分。

只不過(guò)在 WebDev Arena 里,這個(gè)分?jǐn)?shù),叫做 Arena Score。

現(xiàn)在,我們?cè)倩剡^(guò)頭去看,你就能看到,05-06 版,是結(jié)結(jié)實(shí)實(shí)提高了 147 分。。。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

研究過(guò)王者榮耀或者 LOL 的隱藏分也就是 ELO 分機(jī)制的朋友,就知道,這玩意提升 100 多分有多難。。。

這一次,Google 的 Gemini,登頂了。

第二個(gè)亮點(diǎn),也是我覺(jué)得很牛逼的,05-06 版本,也提升了視頻的理解能力,在 VideoMME 基準(zhǔn)測(cè)試中得分為 84.8%。

這就帶來(lái)一個(gè)很有趣的化學(xué)反應(yīng)。

過(guò)去我們經(jīng)常給一個(gè) PDF、給一個(gè)圖片,讓它生成一段可視化網(wǎng)頁(yè),但是現(xiàn)在,你可以,給一個(gè)視頻,來(lái)變成可視化網(wǎng)頁(yè)了。。。

不過(guò)現(xiàn)在有點(diǎn) BUG,Gemini 官網(wǎng)本身不支持視頻的上傳,只能在 AI Studio 里傳視頻,但而上傳的時(shí)候,又經(jīng)常會(huì)報(bào)錯(cuò)。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

Reddit 里很多網(wǎng)友也遇到了這個(gè)問(wèn)題。。。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

Emmmmm,不過(guò),目前使用 YouTube 的在線鏈接生成,目前是可以的。

我們直接打開(kāi) AI studio 的官網(wǎng):

網(wǎng)址:https://aistudio.google.com/

模型調(diào)整至 05-06 版。

在加號(hào)那,選 YouTube。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

我直接扔了一段 OpenAI 發(fā)在 YouTube 上的 Sora 教程上去,然后繼續(xù)用藏師傅的可視化 Prompt。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

很快啊,代碼就跑出來(lái)了。

我們復(fù)制一下,運(yùn)行看看。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

完整版網(wǎng)頁(yè)在此: https://2uwv6grszo.app.yourware.so/

雖然這事,看著很 NTR,但是,他真的很酷啊。

這玩意用于學(xué)習(xí),你就可以想想,他有多棒。

比如我有時(shí)候,回去 YouTube 上看 Blender 教程。

現(xiàn)在,我就可以把這個(gè)視頻和 Prompt 扔給他。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

等輸出完代碼以后,我們看看效果。

用AI把一段視頻變成可視化網(wǎng)頁(yè),Google的新模型又卷飛了!

真的很爽。。。

所以整體來(lái)看,這一次 Gemini 2.5 Pro 05-06 版本,確實(shí)是一次非常實(shí)在的升級(jí)。

既有實(shí)打?qū)嵉拇a能力提升,也在多模態(tài)理解上給到了新可能,尤其是視頻轉(zhuǎn)網(wǎng)頁(yè)這種交叉場(chǎng)景,很可能會(huì)帶來(lái)新的開(kāi)發(fā)范式。

當(dāng)然,Google 現(xiàn)在的問(wèn)題依然是產(chǎn)品打磨還不夠穩(wěn),入口混亂、命名迷惑、交互也還有 bug,但模型本身的進(jìn)步,確實(shí)值得承認(rèn)。

它已經(jīng)不是那個(gè)只靠 PPT 和論文刷存在感的 Gemini 了。

也不再是每次都被 OpenAI 狙擊的 AI 界汪峰了。

接下來(lái)就看 I/O 大會(huì)正式發(fā)布時(shí)。

Google 會(huì)不會(huì)再放出更大一錘了。

我們,拭目以待。

收藏 8
點(diǎn)贊 31

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。