신경망의 구조와 학습: 경량화된 기계 학습의 원리

최근 비디오에서 신경망의 기본 구조에 대한 설명을 했습니다. 이번 글에서는 **경량화된 기계 학습의 핵심인 경사 하강법(gradient descent)**의 개념을 심도 깊게 탐구하고, 우리가 다루고 있는 신경망의 동작 원리를 자세히 알아보겠습니다. 우리의 주요 목표는 손으로 쓴 숫자를 인식하는 전통적인 사례인 MNIST 데이터셋을 통해 신경망의 학습 과정을 이해하는 것입니다. 1. 신경망의 기본 구조 이해하기 손으로 쓴 숫자는 28×28 픽셀로 … Read more

GPT: 생성적 사전 훈련 변환기 이해하기

Transformer의 기본 개념 최근 AI 기술이 빠르게 발전하면서, 많은 사람들이 GPT(Generative Pretrained Transformer)에 대해 궁금해하고 있습니다. 이러한 모델은 텍스트를 생성하는 능력으로 주목받고 있으며, 어떻게 작동하는지 이해하는 것은 이 기술의 발전을 이해하는 데 도움이 됩니다. 이번 블로그에서는 transformer의 기본 개념, 작동 원리 및 다음 단어 예측 과정에 대해 자세히 알아보겠습니다. GPT는 텍스트, 이미지, 오디오 등 다양한 … Read more