1. 서론: 강화 학습의 가능성 최근 기계 학습 모델의 성과를 향상시키기 위해 대량의 감독 데이터를 이용하는 것이 일반적이었습니다. 그러나 DeepSeek-R1-Zero의…
H2: 모델 증류란 무엇인가? AI 기술의 발전과 함께 모델 증류(Knowledge Distillation)가 주목받고 있습니다. 모델 증류는 큰 AI 모델, 즉 "교사…
최근 Deep Seek가 자사의 오픈 소스 추론 모델인 R1을 발표하였습니다. R1은 최신 훈련 전략을 기반으로 하여, 기존의 LLM(대형 언어 모델)과는…
AI 분야에서의 혁신적인 연구 결과들은 종종 전체적인 방향성을 결정짓곤 합니다. 최근에 중국의 AI 기업 Deep Seek가 발표한 연구 논문과 그…
최근 비디오에서 신경망의 기본 구조에 대한 설명을 했습니다. 이번 글에서는 **경량화된 기계 학습의 핵심인 경사 하강법(gradient descent)**의 개념을 심도 깊게…
비트코인(Bitcoin)은 현대 경제에서 혁신적인 디지털 화폐로 자리매김하였습니다. 금전적 거래를 위한 대체 수단으로 시작된 비트코인은 현재 많은 사람들에게 투자 및 거래의…
Transformer의 기본 개념 최근 AI 기술이 빠르게 발전하면서, 많은 사람들이 GPT(Generative Pretrained Transformer)에 대해 궁금해하고 있습니다. 이러한 모델은 텍스트를 생성하는…
서론 여러분은 어떻게 손글씨 숫자 ‘3’을 알아볼 수 있을까요? 픽셀이 흐릿하게 표현된 28x28 이미지도, 다양한 필체의 ‘3’도 순식간에 인식합니다. 이는…
로컬에서 AI 모델을 실행하는 방법과 보안 꿀팁 최근 AI 기술의 발전으로 인해 DeepSeek R1과 같은 대형 AI 모델을 로컬(내 컴퓨터)에서…