DeepSeek-R1:新一代推理模型
專為需要高階決策的複雜任務而設計,DeepSeek-R1突破了AI推理的界限。

高階推理能力
利用強化學習來提升推理能力,使其能執行如數學問題解決與程式設計等複雜任務,並採用連鎖思考、共識與搜尋方法找出最佳答案。
Mixture of Experts (MoE) 架構
一個擁有 6710 億參數的龐大 MoE 模型。每層設有 256 位專家,每個 token 由 8 位不同的專家評估,進而提升推理效率。
超大輸入長度
支援長達 128,000 個 token 的輸入上下文,能夠處理並理解海量資訊。
測試時擴展
DeepSeek-R1 會反覆『思考』以產生更多 token,從而提升輸出品質並優化生成週期。
推理任務中的高效能
在推理基準測試中,其效能可與 OpenAI-o1-1217 相媲美。
多平台支援
可在 NVIDIA NIM(微服務)、Azure AI Foundry(模型目錄)、GitHub 與 Amazon SageMaker AI 上使用。
安全與保障
經過安全評估,包括安全審查和自動檢測,並整合 Azure AI Content Safety 以內建內容過濾。

執行複雜任務
適用於任何需要高階決策和解決問題的任務。
數學問題求解
運用其推理能力來解決複雜的數學挑戰。
程式設計與軟體開發
協助產生程式碼、除錯以及理解複雜的程式庫。
高階語言理解
處理及理解大量文字,從而實現深入分析與獲得見解。

體驗 DeepSeek R1 的功能
