5단계로 알아보는 Deep Seek의 R1 오픈 소스 추론 모델
최근 Deep Seek가 자사의 오픈 소스 추론 모델인 R1을 발표하였습니다. R1은 최신 훈련 전략을 기반으로 하여, 기존의 LLM(대형 언어 모델)과는 다른 새로운 확장 패러다임을 제시하고 있습니다. 이번 블로그 포스트에서는 이러한 추론 모델의 훈련 과정과 그 의미에 대해 깊이 있게 살펴보겠습니다. 1. R1 모델의 훈련 전략 Deep Seek는 R1을 훈련하기 위해 두 가지 주요 단계를 도입했습니다. … Read more