미분류

5가지 방식으로 강화 학습을 활용한 DeepSeek-R1-Zero의 성과

1. 서론: 강화 학습의 가능성 최근 기계 학습 모델의 성과를 향상시키기 위해 대량의 감독 데이터를 이용하는 것이 일반적이었습니다. 그러나 DeepSeek-R1-Zero의…

1개월 ago

7가지 모델 증류의 중요성과 장점

H2: 모델 증류란 무엇인가? AI 기술의 발전과 함께 모델 증류(Knowledge Distillation)가 주목받고 있습니다. 모델 증류는 큰 AI 모델, 즉 "교사…

1개월 ago

5단계로 알아보는 Deep Seek의 R1 오픈 소스 추론 모델

최근 Deep Seek가 자사의 오픈 소스 추론 모델인 R1을 발표하였습니다. R1은 최신 훈련 전략을 기반으로 하여, 기존의 LLM(대형 언어 모델)과는…

1개월 ago

5가지 이유 왜 Deep Seek R1이 AI 분야를 혁신하는가

AI 분야에서의 혁신적인 연구 결과들은 종종 전체적인 방향성을 결정짓곤 합니다. 최근에 중국의 AI 기업 Deep Seek가 발표한 연구 논문과 그…

1개월 ago

신경망의 구조와 학습: 경량화된 기계 학습의 원리

최근 비디오에서 신경망의 기본 구조에 대한 설명을 했습니다. 이번 글에서는 **경량화된 기계 학습의 핵심인 경사 하강법(gradient descent)**의 개념을 심도 깊게…

1개월 ago

비트코인 이해하기: 원리와 구조의 심층 분석

비트코인(Bitcoin)은 현대 경제에서 혁신적인 디지털 화폐로 자리매김하였습니다. 금전적 거래를 위한 대체 수단으로 시작된 비트코인은 현재 많은 사람들에게 투자 및 거래의…

1개월 ago

GPT: 생성적 사전 훈련 변환기 이해하기

Transformer의 기본 개념 최근 AI 기술이 빠르게 발전하면서, 많은 사람들이 GPT(Generative Pretrained Transformer)에 대해 궁금해하고 있습니다. 이러한 모델은 텍스트를 생성하는…

1개월 ago

신경망으로 손글씨 숫자 인식하기: 원리부터 구조까지 한눈에 살펴보기

서론 여러분은 어떻게 손글씨 숫자 ‘3’을 알아볼 수 있을까요? 픽셀이 흐릿하게 표현된 28x28 이미지도, 다양한 필체의 ‘3’도 순식간에 인식합니다. 이는…

1개월 ago

로컬에서 AI 모델 실행하기

로컬에서 AI 모델을 실행하는 방법과 보안 꿀팁 최근 AI 기술의 발전으로 인해 DeepSeek R1과 같은 대형 AI 모델을 로컬(내 컴퓨터)에서…

1개월 ago