
什麼是 DeepSeek R1?
DeepSeek R1 是由 AI 新創公司 DeepSeek 開發的第一代推理模型。它擅長處理需要邏輯推理、數學、程式設計和語言理解的任務,專為執行需要進階決策能力的複雜任務而設計。
DeepSeek-R1 的主要功能
DeepSeek R1 是一款功能強大的 AI 模型,擁有尖端的架構和效能。
進階推理能力
利用強化學習來增強推理能力,使其能夠執行數學解題和程式設計等複雜任務。它採用思維鏈、共識和搜尋方法來找到最佳答案。

混合專家 (MoE) 架構
一個擁有 6710 億個參數的大規模 MoE 模型。每個層級有 256 位專家,每個權杖由 8 位獨立的專家進行評估,從而提高推理效率。

長文本處理能力
支援 128,000 個權杖的輸入文本長度,使其能夠處理和理解大量資訊。

效能與可用性
DeepSeek-R1 提供令人印象深刻的基準測試結果和廣泛的可用性。

推理任務的高效能
在推理基準測試中達到與 OpenAI-o1-1217 相當的效能。

多平台可用性
可在 NVIDIA NIM(作為微服務)、Azure AI Foundry(在模型目錄中)、GitHub 和 Amazon SageMaker AI 上使用。

安全性與保障
已通過安全評估,包括安全審查和自動化評估。與 Azure AI Content Safety 整合,提供內建的內容篩選功能。



