DeepSeek-R1: 차세대 추론 모델
고급 의사결정을 요하는 복잡한 작업을 위해 설계되어, DeepSeek-R1은 AI 추론의 한계를 확장합니다.

고급 추론 능력
강화 학습을 활용하여 추론 능력을 향상시켜, 수학 문제 해결과 코딩과 같은 복잡한 작업을 수행할 수 있습니다. 사고의 흐름, 합의 및 탐색 방식을 사용해 최적의 답을 찾습니다.
Mixture of Experts (MoE) 아키텍처
6710억 파라미터를 가진 대규모 MoE 모델입니다. 각 층은 256명의 전문가로 구성되며, 각 토큰은 8명의 전문가에 의해 평가되어 높은 추론 효율을 제공합니다.
넓은 컨텍스트 길이
최대 128,000 토큰의 입력 컨텍스트 길이를 지원하여 방대한 정보를 처리하고 이해할 수 있습니다.
테스트 시 확장
DeepSeek-R1은 반복적으로 '생각'하여 더 많은 토큰을 생성함으로써 출력 품질을 향상시키고 생성 주기를 최적화합니다.
추론 작업에서의 높은 성능
추론 벤치마크에서 OpenAI-o1-1217과 유사한 성능을 달성합니다.
다양한 플랫폼 지원
NVIDIA NIM(마이크로서비스), Azure AI Foundry(모델 카탈로그), GitHub, 그리고 Amazon SageMaker AI에서 사용 가능합니다.
안전성과 보안
보안 리뷰와 자동 평가를 포함한 안전성 평가를 거쳤습니다. Azure AI Content Safety와 통합되어 내장된 콘텐츠 필터링을 제공합니다.

복잡한 작업 수행
고급 의사결정과 문제 해결이 필요한 모든 작업에 적합합니다.
수학 문제 해결
복잡한 수학 문제에 도전하기 위해 추론 능력을 활용합니다.
코딩 및 소프트웨어 개발
코드 생성, 디버깅, 복잡한 코드베이스 이해에 도움을 줍니다.
고급 언어 이해
대량의 텍스트를 처리하고 이해하여 심층 분석과 통찰을 제공합니다.

DeepSeek R1의 기능을 체험하세요
