自從春節(jié)期間的 deepseek 出圈后,各家大模型就開始瘋狂內(nèi)卷,真應(yīng)了那句話,AI 一天,人間一年。尤其是到了近一個(gè)月,AI 圈更是打的火熱,各大 AI 大廠都在玩命更新,那在這些更新里到底哪個(gè)更好用呢?不知道大家能不能清楚,反正我是有點(diǎn)分不清,所以這個(gè)假期花了幾天時(shí)間,實(shí)驗(yàn)對比了一圈,最終發(fā)現(xiàn)谷歌最新的模型 Gemini 2.5 Pro 成了最好用的。
先簡單介紹下這個(gè)模型,Gemini 2.5 Pro 是谷歌在 3 月 25 號發(fā)布的一個(gè)多模態(tài)模型,它能接受輸入音頻、圖片、視頻和文本,是谷歌當(dāng)前最先進(jìn)的思考型模型,能夠解決各種復(fù)雜問題。
它在各種專業(yè)評分上幾乎都是第一,比如在 LMArena 排行榜(衡量人類偏好)上就遙遙領(lǐng)先,幾乎是全模態(tài)第一。
Gemini 2.5 Pro 還在常見的編碼、數(shù)學(xué)和科學(xué)基準(zhǔn)測試上也表現(xiàn)搶眼。
當(dāng)然,只看評分其實(shí)沒啥概念,只知道很強(qiáng),但我們普通用戶其實(shí)更關(guān)注的是到底能用在哪些地方,好不好用?
和上次我寫的教程《谷歌新出的生圖模型,沒想到把 ComfyUI 的學(xué)習(xí)難度瞬間降低了》一樣,它的使用同樣簡單,最近谷歌確實(shí)有點(diǎn)猛啊,快速出了很多好用的模型,而且都給咱們免費(fèi)用。
先打開官方這個(gè)鏈接(需要魔法) :https://aistudio.google.com/prompts/new_chat
然后選擇 Gemini 2.5Pro Preview 03-25 這個(gè)模型
到這,你就已經(jīng)可以免費(fèi)使用上這個(gè)目前地表最強(qiáng)的 AI 思考模型了。
它的優(yōu)勢有很多:超長記憶能力,目前能記住 100 萬個(gè) token,地表最強(qiáng);它能看懂視頻,圖片,聽懂音頻等等,幾乎全能。
1. 能讀懂記住超長文本文件
看下最新的測試結(jié)果,谷歌最新的這個(gè)模型目前在長文本理解方面,完全沒有對手。
它現(xiàn)在能記住 100 萬個(gè) Token 長度,什么概念呢?
想象一下,傳統(tǒng)的 AI 模型像一個(gè)記憶力有限的學(xué)生,一次只能記住幾頁書的內(nèi)容、而 Gemini 2.5 Pro 就像一位博學(xué)的智者,能夠一口氣“讀”完并深刻理解一部巨著,比如《戰(zhàn)爭與和平》全集(約 70 萬 Token),甚至還有余力。
這不僅僅是能“裝下”更多信息,關(guān)鍵在于理解和關(guān)聯(lián)。
在日常工作中,經(jīng)常需要同時(shí)讀懂大量文檔,并且每個(gè)文檔相互之間還需要關(guān)聯(lián)上,這種長文本的能力就非常需要。我們在實(shí)際工作中的對話往往是非常長的,聊到后面忘記前面是現(xiàn)在很多 AI 的通病。
假如你是一個(gè)項(xiàng)目經(jīng)理,接手了一個(gè)歷史悠久、文檔堆積如山的大型軟件項(xiàng)目。里面有需求文檔、設(shè)計(jì)稿、會議紀(jì)要、郵件往來、甚至幾萬行歷史代碼。你想快速了解項(xiàng)目的來龍去脈、關(guān)鍵決策點(diǎn)和潛在風(fēng)險(xiǎn)。
你可以將這些文檔(總計(jì)可能幾十萬 Token)一次性“喂”給 Gemini 2.5 Pro。然后你可以直接提問:
“總結(jié)一下項(xiàng)目初期最重要的 3 個(gè)技術(shù)選型決策及其原因。”
“根據(jù)所有會議紀(jì)要,用戶反饋?zhàn)罴械墓δ苣K是哪個(gè)?相關(guān)的討論出現(xiàn)在哪些文檔的哪部分?”
它馬上就能給你來個(gè)總結(jié),我這里就不放示例了,你可以自己去試試看,非常有效。
再比如我把我過往寫的部分文章,一次性都丟給 Gemini 2.5 Pro,里面有圖有文字,希望它幫我分析出我最喜歡用的詞語頻次,并由此推測我的文風(fēng)是什么樣的?適合寫什么類型的內(nèi)容。
這是它給出的結(jié)果,可以說非常準(zhǔn)確了。
對比 GPT4.5,效果立馬高下立判。
2. 聽懂音頻文件,總結(jié)錄音內(nèi)容成文字
Gemini 2.5 Pro 不僅擅長處理文本,還能看圖,看視頻,聽聲音,并且得益于能記住超長的上下文,這種能力被提升到了新的高度。
我之前就經(jīng)常苦惱于錄了一段長錄音,然后找音頻轉(zhuǎn)換文本的軟件,發(fā)現(xiàn)大多數(shù)收費(fèi)都非常貴。現(xiàn)在用谷歌 Gemini,不僅免費(fèi)還能直接幫我總結(jié)形成文字給我,非常實(shí)用。
上傳音頻文件,然后直接寫提示詞:“幫我把這一段錄音文件轉(zhuǎn)換為文字稿,并總結(jié)出其中的關(guān)鍵內(nèi)容”
它能基于錄音的內(nèi)容分析出的每一句文字內(nèi)容,最后還幫我做了總結(jié),整個(gè)過程大概就花了 3 分鐘就搞定了,非常效率。
3. 看懂視頻,找出視頻中的關(guān)鍵信息
可以上傳一段本地拍的視頻,也可以直接用網(wǎng)上的一個(gè)視頻鏈接(目前僅支持 youtube),它就能直接分析出視頻里的所有內(nèi)容,甚至理解視頻中每一幀的畫面內(nèi)容,這個(gè)能力真的太有用了。尤其像我習(xí)慣看長視頻教程的人,對我來說非常實(shí)用。
分析完成后,它會告訴我總結(jié)之后的結(jié)果
對于能解析本地拍的視頻,這個(gè)能力其實(shí)非常有用,比如在平時(shí)自己拍的一段視頻,希望能分析出視頻中自己的情緒變化。
比如還可以把 B 站的視頻下載下來,通過分析彈幕上的文本了解觀眾對哪個(gè)功能的討論最熱烈?主要觀點(diǎn)有哪些?針對視頻中的哪部分內(nèi)容,什么畫面帶來的情緒變化等等。
比如還可以問“發(fā)布會上的老板是在哪個(gè)時(shí)間點(diǎn)開始介紹新產(chǎn)品?他強(qiáng)調(diào)了哪些核心賣點(diǎn)?” ,順便還讓它總結(jié)一下 35 分鐘到 45 分鐘這段 Q&A 環(huán)節(jié)的主要問題和回答。 甚至還能讓它總結(jié)出視頻中人物一共鼓掌了多少次。
它能像人一樣“看”視頻,理解畫面內(nèi)容、識別語音、定位關(guān)鍵幀,甚至進(jìn)行一定的情感分析,我們不需要再手動拉進(jìn)度條或單獨(dú)做文字記錄了。
如果以上這些多模態(tài)能力,還不足以震撼到你我的話。更強(qiáng)悍的是當(dāng)你實(shí)際用的時(shí)候,你就會發(fā)現(xiàn),它真的比其他模型更厲害,沒有對比就沒有傷害。
比如就單純在問答這塊的能力,我們來對比下試試。
我以星球里一位星友的提問為例
這是 deepseek 的回答:
這是谷歌 Gemini 2.0Pro 的回答。對比看的話,Gemini 更能抓住問題的重點(diǎn),它似乎就是能讀懂你想問的。
我們在用其他像 GPT 和 deepseek 之類的 AI,你可能會發(fā)現(xiàn),它們往往會順著你的意思去回答,但 Gemini 會有自己的明確見解,能告訴你就要怎么做才好,能給出明確的建議,這是一個(gè)很好用的地方。因?yàn)槲覀兺ǔJ且医ㄗh,還不只是看它幫我們分析,然后又不給結(jié)論。
比如再舉一個(gè)星友的提問,也是比較常見的問題。
先看下 deepseek 的回答
再看下 Gemini 的回答
對比看下來,我發(fā)現(xiàn) Gemini 的回答是更有人味的,更像是我自己的在回答,和朋友聊天一樣。
對于這一點(diǎn)來說,其實(shí)如果你自己不去真正用下的話,估計(jì)很難體會到,但我自己近段時(shí)間在用的時(shí)候是真切的體會到它的聰明、理性,對比其他工具來說,更加順暢好用,關(guān)鍵還免費(fèi)。
所以,有了一個(gè)這樣能識別多模態(tài),好用實(shí)用的 AI 工具,趕緊用起來吧。
我在想,在如今的 AI 時(shí)代,最核心的不是去關(guān)注到這些 AI 的發(fā)展,關(guān)注到它每天的更新變化,更重要的是要真的去把它們用起來,只有真正用到實(shí)際生產(chǎn)中,才能讓 AI 給自己帶來真正的能量。
歡迎關(guān)注作者的微信公眾號:「彩云譯設(shè)計(jì)」
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺,提供獎(jiǎng)品贊助 聯(lián)系我們
標(biāo)志設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 729 位幸運(yùn)星
發(fā)表評論 為下方 9 條評論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓