近日 DeepSeek R2 的最新參數引發了行業內外的廣泛關注,以下是爆料的關鍵信息:
?? 參數規模:1.2萬億參數,780億活躍參數,采用混合專家模型(MoE)架構。
?? 成本優勢:與GPT-4相比,成本大幅降低,輸入每百萬次僅需0.07美元,輸出每百萬次僅需0.27美元,成本降低97.3%。
?? 訓練數據:使用了5.2PB的訓練數據,在C-Eval 2.0測試中達到了89.7%的準確率。
?? 視覺性能:在COCO(Common Objects in Context)圖像識別測試中,準確率高達92.4%,視覺性能顯著提升。
?? 硬件適配:在華為昇騰910B芯片上的利用率高達82%,顯示出良好的硬件適配性。
此次泄露的信息顯示,DeepSeek R2正逐步擺脫對美國供應鏈的依賴,這一轉變可能對全球AI產業格局產生深遠影響。有業內人士指出,部分爆料內容存在邏輯矛盾,甚至存在外網推文引用中文非正規渠道消息的情況。關于DeepSeek R2的發布時間及網傳參數真實性,仍需謹慎看待。
如果DeepSeekR2真的發布了,對此你有什么期待?