小道消息一直在說,前天深夜或者昨天凌晨,阿里會(huì)發(fā) Qwen3。
然后我特意早早的睡了一兩小時(shí),凌晨 1 點(diǎn)起床,就為了等 Qwen3 發(fā)。
結(jié)果這一等,就是好幾個(gè)小時(shí)。。。
不過,功夫不負(fù)有心人。
凌晨 5 點(diǎn),我眼睛都睜不開的時(shí)候,終于等到了。
Qwen 你賠我睡眠。。。
把報(bào)告看完,我總結(jié)一下,覺得最大的亮點(diǎn)有 6 個(gè):
- 模型能力登頂全球,這個(gè)沒啥可說的,就是 No.1。
- 第一個(gè)開源的混合推理模型。
- 8 個(gè)不同尺寸的模型,幾乎覆蓋了所有場(chǎng)景。
- 成本很低,旗艦?zāi)P?235B 參數(shù)部署成本只要 DeepSeek R1 的三分之一。
- 支持 MCP 協(xié)議。
- 居然還支持了 119 種語言。
一起說吧。
這次發(fā)了 8 個(gè)模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,這 6 個(gè)都是 Dense 稠密模型。
還有兩個(gè)重量級(jí) MoE 模型,Qwen3-30B-A3B,和旗艦版的 Qwen3-235B-A22B。
這次 Qwen 采用了新的命名方式,Qwen3-0.6B、1.7B、32B 這種沒啥可說的,大家都理解。
兩個(gè) MoE 模型,把激活的參數(shù)寫在后面,Qwen3-235B-A22B 的意思就是 235B 的參數(shù),但是在推理時(shí)只激活 22B。
Qwen3-30B-A3B 就是總參數(shù)量為 30B,激活參數(shù) 3B,這個(gè)還蠻有意思的。
而且,所有的模型,都是混合推理模型。
大概的意思就是,你既可以把它當(dāng)不會(huì)長(zhǎng)思考沒有思維鏈的普通模型用,也可以直接開啟推理模式,變成一個(gè)推理模型。
可以簡(jiǎn)單的理解為,把 DeepSeek V3 和 R1 直接揉在了一起。
就像我們其實(shí)都知道,DeepSeek 這個(gè)深度思考,你打開的時(shí)候,是 R1 模型,但是你關(guān)掉,其實(shí)用的是 v3 來給你回答。
但是 Qwen3,是一體的。
是一個(gè)模型,只不過支持了兩種模式,這個(gè)不管對(duì)于開發(fā)者還是使用者,都方便很多。
整體上,8 個(gè)模型,誠(chéng)意足到爆炸,小到 0.6B,大到 235B,能打手機(jī)端側(cè),也能打旗艦體驗(yàn),全部一次性開源了,而且都是 Apache 2.0 協(xié)議,想怎么用就怎么用,想商用就商用,沒啥顧慮。
Qwen3-0.6B~4B 的最大 Token 都是 32K,其他的都是 128K。
性能上,稍微有點(diǎn)離譜。
Qwen3-4B 的小模型,就已經(jīng)能和上一代 QwQ-32B 這玩意打得有來有回。而 Qwen3-30B-A3B,更是幾乎就比 QwQ-32B 全方位的強(qiáng)。
至于最牛逼的那個(gè) Qwen3-235B-A22B,他們甚至沒只跟開源模型比,比的全都是最頂級(jí)的閉源模型。
最主要的是,這玩意部署成本,大概只有 DeepSeek R1 的三分之一啊。。。
什么叫便宜大碗,這就是。
但是這么一對(duì)比,忽然發(fā)現(xiàn),Gemini2.5-Pro,好像有點(diǎn)猛。。。
同時(shí),在性能水桶式提升的背景下,也有了更強(qiáng)的 Agent 能力,也支持 MCP 了。
他們官方自己放了一段視頻。
我也隨手把即夢(mèng)接了進(jìn)去,可以直接用 Qwen3 來調(diào)用即夢(mèng)畫圖了。。。
就還真的,挺好玩,你的下一個(gè)即夢(mèng),又何必是即夢(mèng)呢(狗頭。
除了這些模型的能力,Qwen3 這次還有一個(gè)很有趣的東西。
就是語言。
上一代的 Qwen2.5,只支持包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等 29 種語言。
而這一次,支持 119 種語言了。
不是,到底誰才是真正的 OpenAI 啊。
這妥妥是為世界人民謀福利好吧。。。
項(xiàng)目地址都在這了。
Blog: https://qwenlm.github.io/blog/qwen3/
GitHub: https://github.com/QwenLM/Qwen3
你牛逼的話可以自己部署,我 5080 勉強(qiáng)跑個(gè) Qwen3-8B,實(shí)在跑不起。
想體驗(yàn)的話,可以直接去通義和 Qwen Chat,都可以。
通義: https://www.tongyi.com/qianwen/
Qwen Chat: https://chat.qwen.ai/
我自己直接在 Qwen Chat 上面實(shí)測(cè)了一波,一進(jìn)來左上角就默認(rèn)是旗艦版 Qwen3。
嗯,就是比較抽象的是,提示語都居然都變成早上好,卡茲克了。。。
你可以在左上角,切換 3 個(gè)這次 Qwen3 比較有代表的模型來進(jìn)行對(duì)比。
左下角的深度思考,就能是否開啟推理的開關(guān)。
而且這個(gè)開關(guān)還能拖動(dòng)滑塊,決定它的最大思考長(zhǎng)度,雖然這個(gè)功能很極客,但是還有意思。
我自己的實(shí)測(cè)結(jié)論就是:水桶級(jí)別,中等偏上。
比如讓它給我生成一個(gè)登錄頁。
效果很不錯(cuò),能直接干出一個(gè)很酷的界面。
或者做藏師傅搞得可交互的網(wǎng)頁,把吃瓜 PDF 變成在線時(shí)間線。
這時(shí)候你就會(huì)發(fā)現(xiàn),審美會(huì)差一點(diǎn),豐富度也會(huì)不是特別夠,稍微有一點(diǎn)點(diǎn)勉強(qiáng)了。
藏師傅之前的可視化網(wǎng)頁 Prompt 如下:
我會(huì)給你一個(gè)文件,分析內(nèi)容,并將其轉(zhuǎn)化為美觀漂亮的中文可視化網(wǎng)頁作品集:
## 內(nèi)容要求 - 保持原文件的核心信息,但以更易讀、可視化的方式呈現(xiàn) - 在頁面底部添加作者信息區(qū)域,包含: * 作者姓名: [作者姓名] * 社交媒體鏈接: 至少包含 Twitter/X: - 版權(quán)信息和年份 ## 設(shè)計(jì)風(fēng)格 - 整體風(fēng)格參考 Linear App 的簡(jiǎn)約現(xiàn)代設(shè)計(jì) - 使用清晰的視覺層次結(jié)構(gòu),突出重要內(nèi)容 - 配色方案應(yīng)專業(yè)、和諧,適合長(zhǎng)時(shí)間閱讀 ## 技術(shù)規(guī)范 - 使用 HTML5、TailwindCSS 3.0+(通過 CDN 引入)和必要的 JavaScript - 實(shí)現(xiàn)完整的深色/淺色模式切換功能,默認(rèn)跟隨系統(tǒng)設(shè)置 - 代碼結(jié)構(gòu)清晰,包含適當(dāng)注釋,便于理解和維護(hù) ## 響應(yīng)式設(shè)計(jì) - 頁面必須在所有設(shè)備上(手機(jī)、平板、桌面)完美展示 - 針對(duì)不同屏幕尺寸優(yōu)化布局和字體大小 - 確保移動(dòng)端有良好的觸控體驗(yàn) ## 媒體資源 - 使用文檔中的 Markdown 圖片鏈接(如果有的話) - 使用文檔中的視頻嵌入代碼(如果有的話) ## 圖標(biāo)與視覺元素 - 使用專業(yè)圖標(biāo)庫如 Font Awesome 或 Material Icons(通過 CDN 引入) - 根據(jù)內(nèi)容主題選擇合適的插圖或圖表展示數(shù)據(jù) - 避免使用 emoji 作為主要圖標(biāo) ## 交互體驗(yàn) - 添加適當(dāng)?shù)奈⒔换バЧ嵘脩趔w驗(yàn): * 按鈕懸停時(shí)有輕微放大和顏色變化 * 卡片元素懸停時(shí)有精致的陰影和邊框效果 * 頁面滾動(dòng)時(shí)有平滑過渡效果 * 內(nèi)容區(qū)塊加載時(shí)有優(yōu)雅的淡入動(dòng)畫 ## 性能優(yōu)化 - 確保頁面加載速度快,避免不必要的大型資源 - 實(shí)現(xiàn)懶加載技術(shù)用于長(zhǎng)頁面內(nèi)容 ## 輸出要求 - 提供完整可運(yùn)行的單一 HTML 文件,包含所有必要的 CSS 和 JavaScript - 確保代碼符合 W3C 標(biāo)準(zhǔn),無錯(cuò)誤警告 - 頁面在不同瀏覽器中保持一致的外觀和功能 請(qǐng)根據(jù)上傳文件的內(nèi)容類型(文檔、數(shù)據(jù)、圖片等),創(chuàng)建最適合展示該內(nèi)容的可視化網(wǎng)頁。
而如果再讓它寫一個(gè)之前我在文章里放的洛小山的彈球游戲。就確實(shí)沒有那么亮眼,在游玩的時(shí)候還有一些些 BUG。
但是畢竟這個(gè)游戲還是太復(fù)雜了,人模型的尺寸也沒那么大,也沒法既要又要。
如果是做稍微簡(jiǎn)單一點(diǎn)的連連看游戲,就還是比較簡(jiǎn)單了。
<!-- 生成一個(gè)記憶翻牌游戲,要求: 1. 使用CSS漸變背景(深紫到黑) 2. 12張圓角卡片(6對(duì)圖案),默認(rèn)顯示彩色霓虹邊框 3. 點(diǎn)擊卡片翻轉(zhuǎn)時(shí)顯示emoji圖案,匹配成功時(shí)卡片變?yōu)榘胪该靼l(fā)光狀態(tài) 4. 頂部顯示極簡(jiǎn)計(jì)時(shí)器和步數(shù)統(tǒng)計(jì) 5. 禁止使用圖片,全部用CSS繪制 --> <div id="memory-game" style="background: linear-gradient(135deg, #3a0ca3, #000);"> <!-- JS動(dòng)態(tài)生成卡片 --> </div>,所有的游戲文字都是英文
除了代碼,邏輯問題,現(xiàn)在基本也不太能難道現(xiàn)在的推理大模型了。
不過在遇到一些非常離奇非正常的測(cè)試 prompt 時(shí),還是會(huì)有一點(diǎn)點(diǎn)掉智。
文筆的話,親測(cè)會(huì)比 DeepSeek 好一些。
但是略遜于 GPT-4o。
如果你還想玩一點(diǎn)花活,還能跟即夢(mèng)打通做結(jié)合。
就能實(shí)現(xiàn)類似于那種原生多模態(tài)模型,圖文混排的效果。
還是超級(jí)有意思的。
總之,這次 Qwen3 的發(fā)布,真的有點(diǎn)像是深夜街頭,突然亮起的那盞霓虹燈。
不僅亮,還便宜。
不僅便宜,還能庫庫的切換顏色。
這一波下來,阿里確實(shí)是拿出了一種很阿里的態(tài)度。
8 點(diǎn)了,天也亮了。
該去睡覺了。
最后。
Qwen3,歡迎來到這個(gè)荒誕又燦爛的時(shí)代。
咱們,下個(gè)奇點(diǎn)見。
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評(píng)論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評(píng)論區(qū)留言,系統(tǒng)會(huì)隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國(guó)內(nèi)備受歡迎的設(shè)計(jì)師平臺(tái),提供獎(jiǎng)品贊助 聯(lián)系我們
標(biāo)志設(shè)計(jì)標(biāo)準(zhǔn)教程
已累計(jì)誕生 729 位幸運(yùn)星
發(fā)表評(píng)論
↓ 下方為您推薦了一些精彩有趣的文章熱評(píng) ↓