av在线不卡免费观看,久久精品亚洲一区二区,激情视频网站在线播放色

降維打擊所有模型！OpenAI正式發布o3

往期AI圈重磅消息：

碾壓Sora！谷歌全新發布AI視頻模型Veo2+AI繪圖Imagen3

更多AI干貨：大半夜的，OpenAI 的垃圾直播沒任何看頭，就發了個個性化的 AI 搜索。

閱讀文章 >

OpenAI 的 12 天直播，終于來到了最終章。奧特曼，也在一片圣誕的氣息中終于回歸。為大家帶來了最后的壓軸大戲。

OpenAI o3。

降維打擊所有模型！OpenAI正式發布o3

又一次超群，又一次把模型的能力，推到了新的高度。

也向全世界證明了，OpenAI，依然在鐵王座上牢不可摧。

我也想起了 OpenAI 研究員在發布 o1 之前的那句話：

“我們通往 AGI 的路上，已經沒有任何阻礙了”

之所以 OpenAI 直接發布 o3 沒有 o2，原因也挺簡單的。

因為跟英國電信服務提供商 O2 可能存在版權或商標沖突，所以直接跳過了。。。

直接到 o3。

而 OpenAI 直播一完，X 上基本就沸騰了。

降維打擊所有模型！OpenAI正式發布o3

o3 的能力，對現在所有模型，幾乎都直接是降維打擊。

看下 o3 的能力吧。

一些粗的評測集簡單過一下。

降維打擊所有模型！OpenAI正式發布o3

左邊的是軟件工程考試（SWE-Bench Verified），這就像是一個考寫程序的考試，比如你寫一個軟件要它快速、準確，還不能有 bug（小錯誤）。這是考察 o3 是否能像一流的軟件工程師一樣寫出完美的代碼。

o3 的成績：71.7%，比 o1 還強了不少。

右邊的那個基準比較猛，Codeforces，一個全球著名的編碼競賽平臺。

o3 的得分是 2727，這個得分，相當于整個榜單的第 175 名，已經超越了 99.99%的人類了。

降維打擊所有模型！OpenAI正式發布o3

o1 的代碼能力已經強到爆炸了，而 o3，又向 AGI 的山頂，前進了一大步。

降維打擊所有模型！OpenAI正式發布o3

數學競賽 AIEM 2024 和博士級科學考試 GPQA Diamond。

AIEM 2024 接近滿分，如果我沒記錯的話，這應該也是第一次 AI 能達到有 AIEM 接近滿分的水平。

博士級科學考試有進化，但沒數學和編程進化的這么猛。

接下來的這個數學基準比較有趣一點。

降維打擊所有模型！OpenAI正式發布o3

FrontierMath，Epoch AI 開發的一個數學基準測試，由 60 多位頂尖數學家的合作開發，旨在評估人工智能在高級數學推理方面的能力。

而且為了避免數據污染，所有的題目都是原創的且從來沒有發布過的新題目。

之前 GPT-4 和 Gemini 1.5 Pro 這種模型去評估的時候，成功功率不足 2%，與其他傳統數學基準（如 GSM-8K 和 MATH）中超過 90%的成功率形成鮮明對比。

而這一次，o3 直接達到了 25.2。

當各大其他模型都還在卷傳統數學基準的時候，o3 真的已經進入了另一個世界了。。。

就像大家還在大斗師階段互相卷，你是五星大斗師，我是八星大斗師。

兩者爭論不休，正準備要比試比試，忽然就看到一個斗宗強者踏空而行，留下一地的臥槽。

這還比個鬼。

然后，就是我覺得，整個基準里，最有趣的一個基準了：ARC-AGI。

先說說這是個啥玩意。

ARC-AGI 于 2019 年首次提出，旨在通過一系列抽象和推理任務來測試 AI 系統的能力。

主要是因為傳統的技能測量方法并不能有效代表智能，因為它們往往依賴于先前知識和經驗，而真正的智能應體現在廣泛的適應能力和通用性上。

所以，ARC-AGI 誕生了，里面的這些任務要求 AI 識別模式并解決新問題，每個任務由輸入輸出示例組成。這些任務以網格形式呈現，每個方塊可以是十種顏色中的一種，網格的大小可以從 1x1 到 30x30 不等。參與者需要根據給定的輸入生成正確的輸出，測試其推理和抽象能力。

可以簡單的理解成，找規律。

大概就是這樣的。

降維打擊所有模型！OpenAI正式發布o3

非常的難且抽象。

過去幾代模型的評分在此：

GPT-2 (2019): 0%
GPT-3 (2020): 0%
GPT-4 (2023): 2%
GPT-4o (2024): 5%
o1-preview (2024): 21%
o1 (2024): 32%
o1 Pro (2024): ~50%

但是今天，o3 的分數，達到了恐怖的 87.5%。

降維打擊所有模型！OpenAI正式發布o3

從 0%到 5%，整整花了 5 年的時間，而如今，從 5%到 87.5%，僅僅只花了半年。

而對應的，人類的閾值分數，是 85%。

我們通往 AGI 的路上，已經沒有任何阻礙了。

不過 o3 強歸強，但是又是一個期貨，OpenAI 目前只對紅隊開放，如果是巨佬的話，可以去申請試試。

降維打擊所有模型！OpenAI正式發布o3

網址在此： https://openai.com/index/early-access-for-safety-testing/

目前不知道 o3 什么時候放出，但是 OpenAI 又基于 o3，訓了 3 個小尺寸的 o3 模型。

降維打擊所有模型！OpenAI正式發布o3

目前 o3-mimi，預估在 1 月底可以對外開放，但是感覺到時候，肯定又是 pro 會員專屬的模型了。

我越來越期待，2025 年 AI 行業的進化了。

推理模型、Agent、AI 硬件、世界模型。

每一個都是比這個中間態的 2024，都更讓人興奮的東西。

2025，必是 AI 行業，真正的星辰大海。

我們也在最后，回顧一下這 12 天的直播吧。

Day 1：滿血 o1 上線，ChatGPT Pro 會員上線，o1 pro 推出。

降維打擊所有模型！OpenAI正式發布o3

Day 2：基于 o1 的強化微調。

Day 3：Sora 正式發布。

降維打擊所有模型！OpenAI正式發布o3

Day 4：ChatGPT Canvas 全員開放以及小功能更新。

Day 5：給蘋果站臺，宣傳蘋果全系接入 GPT。

Day 6：4o 的實時視頻理解上線。

降維打擊所有模型！OpenAI正式發布o3

Day 7：ChatGPT 發布新建文件夾“項目”功能。

降維打擊所有模型！OpenAI正式發布o3

Day 8：ChatGPT Search 全量開放，搜索體驗大幅優化。

Day 9：發布了 o1 的 API、更新了實時語音的 API、發布了偏好微調能力（PFT）。

Day 10：物理意義上的可以給 ChatGPT 打電話了。

降維打擊所有模型！OpenAI正式發布o3

Day 11：炒冷飯，ChatGPT 桌面版能讀到別的應用。

Day 12：OpenAI o3 正式發布。

降維打擊所有模型！OpenAI正式發布o3

這 12 天，稍微有點驚喜的日子大概只有 2、3 天，其他都是垃圾時間。

還好，今天的大貨，補上了之前的陰霾。

最后，還是忍不住感嘆一聲。

這 12 天，像一場漫長的馬拉松。

我們經歷了深夜中數不勝數的垃圾時間。

卻也迎來了最后的高光時刻。

這感覺。

還挺 AI 的。

歡迎關注作者的微信公眾號：數字生命卡茲克

降維打擊所有模型！OpenAI正式發布o3

數字生命卡茲克

文章 39 人氣 83.0w

AI自媒體

+關注作者

點贊 46

復制本文鏈接文章為作者獨立觀點不代表優設網立場，未經允許不得轉載。

繼續閱讀本文相關話題

AIGC

學AI

AI導航

菜單 優設網uisdc.com 優設網 - 學設計上優設

您還未登錄

登錄后即可體驗更多功能

降維打擊所有模型！OpenAI正式發布o3

2024/12/23 推薦： 數字生命卡茲克閱讀 2.0w 評論有獎 閱讀本文需 8 分鐘

碾壓Sora！谷歌全新發布AI視頻模型Veo2+AI繪圖Imagen3

OpenAI o3。

數字生命卡茲克

文章 39 人氣 83.0w

繼續閱讀本文相關話題

83.0w人氣 39文章

本文3套知識9圖

Labubu玩偶的超級變身9連發，一鍵Get生成配方！

超全AIGC動畫制作教程，30秒學會電影級分鏡！

提示詞直出即用！8組超實用折紙ICON素材合集！

文章目錄

文章目錄

你即將學會 潘通2025年度色 的知識

超多案例！五大章節讀懂2025潘通年度色「摩卡慕斯」

4.4w 人閱讀

上一篇

你即將學會 B端設計 的知識

沒靈感看這里！20個大廠PC端官網設計思路匯總

6.6w 人閱讀

下一篇

發評論！每天贏獎品

點擊 登錄 后，在評論區留言，系統會隨機派送獎品

2012年成立至今，是國內備受歡迎的設計師平臺，提供獎品贊助 聯系我們

標志設計標準教程

已累計誕生 729 位幸運星

發表評論 為下方 3 條評論點贊，解鎖好運彩蛋

↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓

數字生命卡茲克

數字生命卡茲克

數字生命卡茲克

數字生命卡茲克

WOWDesign

優設推薦官精選熱門話題

提示詞

文章 461

用戶體驗設計

文章 575

網頁設計

文章 1019

Midjourney

文章 1103

評論

收藏

分享

AI趨勢

入站必看

設計入門

進階提升

熱門資源

最新AI工具

300+實用AI工具全收錄

Midjourney

會上癮的AI繪畫工具

AI智能繪畫

讓AI助你一臂之力

Blender

稱心如意的3D設計法寶

Figma

令設計師愛不釋手

HMI設計指南

車載設計教科書

直播間設計

生意都在直播間啦

Stable Diffusion

最強開源AI繪畫工具

優設熱榜

每日必讀的行業消息

教你做字庫

每個公司都可有字庫

設計服務

一站式數字創意服務平臺

求職面試

為你用心整理的技巧

B端設計

開始探索B端設計

菜單優設網 - 學設計上優設

降維打擊所有模型！OpenAI正式發布o3

2024/12/23 推薦：數字生命卡茲克閱讀 2.0w 評論有獎閱讀本文需 8 分鐘

碾壓Sora！谷歌全新發布AI視頻模型Veo2+AI繪圖Imagen3

OpenAI o3。

Labubu玩偶的超級變身9連發，一鍵Get生成配方！

超全AIGC動畫制作教程，30秒學會電影級分鏡！

提示詞直出即用！8組超實用折紙ICON素材合集！

你即將學會潘通2025年度色的知識

你即將學會 B端設計的知識

發評論！每天贏獎品

點擊登錄后，在評論區留言，系統會隨機派送獎品

2012年成立至今，是國內備受歡迎的設計師平臺，提供獎品贊助聯系我們

發表評論為下方 3 條評論點贊，解鎖好運彩蛋