深度求索(DeepSeek)正式推出新一代開源大模型DeepSeek-R1-0528,該模型已在HuggingFace平臺開源并更新技術文檔。官方宣稱,其數學推理、編程能力等核心指標已逼近GPT-4o、Gemini 2.5 Pro等國際領先模型。
關鍵性能突破
據模型卡信息顯示,R1-0528在AIME等高難度數學測試中得分顯著提升,邏輯推理能力實現突破性優化。同時,新增JSON結構化輸出與函數調用功能,可直接對接自動化系統與前后端開發,大幅降低工程化部署門檻。在文本生成方面,新模型幻覺率降低約40%,議論文、小說等創作類任務的自然度接近人類水平。
輕量化部署方案
技術團隊首次將R1-0528的"思維鏈"能力蒸餾至Qwen3-8B模型,使其推理性能超越原版Qwen3-8B,逼近參數規模大30倍的Qwen3-235B版本,為移動端、邊緣計算等輕量化場景提供新選擇。實測數據顯示,該模型在Web前端開發任務中的代碼生成效率提升26%。
開發者生態布局
目前該模型權重已在HuggingFace開放下載,官方同步釋出適配文檔與API接入指南。業內人士預測,未來兩周內將有大量企業宣布接入該模型。
體驗入口:chat.deepseek.com
API文檔:api-docs.deepseek.com/guides/reasoning_model
模型權重:huggingface.co/deepseek-ai/DeepSeek-R1-0528