載入中...

DeepSeek-R1：新一代推理模型

專為需要高階決策的複雜任務而設計，DeepSeek-R1突破了AI推理的界限。

什麼是 DeepSeek R1？

高階推理能力
利用強化學習來提升推理能力，使其能執行如數學問題解決與程式設計等複雜任務，並採用連鎖思考、共識與搜尋方法找出最佳答案。

Mixture of Experts (MoE) 架構
一個擁有 6710 億參數的龐大 MoE 模型。每層設有 256 位專家，每個 token 由 8 位不同的專家評估，進而提升推理效率。

超大輸入長度
支援長達 128,000 個 token 的輸入上下文，能夠處理並理解海量資訊。

測試時擴展
DeepSeek-R1 會反覆『思考』以產生更多 token，從而提升輸出品質並優化生成週期。

推理任務中的高效能
在推理基準測試中，其效能可與 OpenAI-o1-1217 相媲美。
多平台支援
可在 NVIDIA NIM（微服務）、Azure AI Foundry（模型目錄）、GitHub 與 Amazon SageMaker AI 上使用。
安全與保障
經過安全評估，包括安全審查和自動檢測，並整合 Azure AI Content Safety 以內建內容過濾。

DeepSeek R1 的應用場合

執行複雜任務
適用於任何需要高階決策和解決問題的任務。
數學問題求解
運用其推理能力來解決複雜的數學挑戰。
程式設計與軟體開發
協助產生程式碼、除錯以及理解複雜的程式庫。
高階語言理解
處理及理解大量文字，從而實現深入分析與獲得見解。

開始使用 DeepSeek R1

開始使用 DeepSeek R1

1.
NVIDIA NIM
以 NVIDIA NIM 微服務存取 DeepSeek-R1，建立專屬代理。
2.
Azure AI Foundry
在 Azure AI Foundry 的模型目錄中尋找 DeepSeek-R1，以便進行試驗及整合。
3.
GitHub
探索 DeepSeek-R1 在 GitHub 倉庫中的資源與整合指南。

體驗 DeepSeek R1 的功能

體驗 DeepSeek R1 的功能

更多關於 DeepSeek R1 的文章