수식이 나오지 않는다면 새로고침(F5)을 해주세요
모바일은 수식이 나오지 않습니다.
딥러닝(Deep Learning)은 인공지능(AI)의 한 분야로, 인간의 뇌가 정보를 처리하는 방법을 모방하여 데이터를 학습하는 기술입니다.(뉴런!). 최근 핫한 컴퓨터 비전, 자연어 처리, 음성 인식 등등 모두 딥러닝이 베이스가 된 기술들입니다.
때문에 인공지능 분야를 공부하는 분들은 딥러닝이 매우 기초가 된다는 것을 알 것이라 생각합니다. 하지만, 머신러닝과 다르게 딥러닝에 대한 지식이 부족한 분들이 많을 것이라 생각합니다. 머신 러닝을 좀 더 깊이 바라본 것이지만 그 안의 내용은 머신러닝을 뛰어넘는 지식을 요구하는 경우가 많습니다.
그럼 딥러닝의 기본 개념과 구성 요소 등을 한 번 알아보겠습니다.
📌 딥러닝 기본 개념
딥러닝은 기본 적으로 다층 신경망(Deep Neural Network, DNN)을 활용하여 데이터를 학습합니다. 신경망은 인간의 뇌를 모방한 것으로 뉴런(Neuron)이라는 작은 단위들로 구성되며, 각 뉴런은 입력(input)을 받아 가중치(weight)를 통해 처리하고, 활성화 함수(activation function)를 통해 출력값(output)을 계산합니다.
이러한 뉴런들이 여러 층으로 구성된 구조가 다층 신경망입니다.
- 뉴런(Neuron) : 입력값을 받아 가중치와 곱한 후 활성화 함수를 통해 출력값을 계산하는 단위.
- 가중치(Weight) : 뉴런 간의 연결 강도를 나타내는 값으로, 학습(train)을 통해 조정
- 활성화 함수(Activation Function) : 뉴런의 출력을 비선형적으로 변환하는 함수.[Sigmoid, Softmax, ReLU. etc]
- 층(Layer) : 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 누뉘고, 은닉층이 많을수록 더 깊은 신경망이 된다.
📌 작동 원리
딥러닝 학습 과정은 크게 두 가지 단계로 나눌 수 있습니다. 순전파(Forward Propagation)와 역전파(Backward Propagation)입니다. 아마 역전파 알고리즘에 대해서 많이 들어보셨을 것으로 예상됩니다.
- 순전파 : 입력 데이터가 입력층으로 들어오고 각 층의 뉴런에서 가중치와 활성화 함수를 통해 처리되며, 최종적으로 출력층에 도달하여 예측값을 생성합니다. 말그래도 순차적으로, 순서대로 진행되는 작동원리 입니다.
- 역전파 : 예측값과 실제값 사이의 오차를 계산하고, 이 오차를 최소화하기 위해 가중치를 조정합니다. 이는 경사 하강법(Gradient Descent) 알고리즘을 통해 이루어집니다.(아마 부스팅과 같은 ML 알고리즘에 익숙하시 다면 이해하기 쉬울 것입니다.)
📌 주요 기술 및 알고리즘
딥러닝에서 사용하는 다층 신경망(DNN)외에도 대표적인 신경망 구조와 알고리즘이 존재합니다. DL에 관심이 있으시다면 많이 들어보셨을 겁니다.
- 합성곱 신경망(Convolution Neural Network, CNN) : 주로 이미지 인식 및 처리에 사용되며, 합성곱 층(Convolutional Layer)과 풀링 층(Pooling Layer)로 구성됩니다.
- 순환 신경망(Recurrent Neural Network, RNN) : 시간에 따라 순차적으로 입력되는 데이터(시계열 데이터 등)을 처리하는 데 사용됩니다. LSTM(Long Short-Term Memory)와 GTU(Gated Recurrent Unit)와 같은 변형이 존재합니다.
- 생성적 적대 신경망(Generative Adversarial Network, GAN) : 두 개의 신경망(생성자와 판별자)이 서로 경쟁하며 학습하는 구조로, 주로 새로운 데이터를 생성하는 데 사용됩니다.
위 세가지를 제외하더라도 최근 많이 사용하는 트랜스포터와 같은 추가적인 알고리즘이 많이 존재합니다.
📌 딥러닝 응용 분야
우리가 딥러닝을 알아야하는 이유입니다. 현재 대부분의 AI 분야에서 사용되기 때문입니다.
- 컴퓨터 비전(Computer vision) : 이미지 분류, 객체 인식, 자율 주행 자동차 등
- 자연어 처리(Natural Language Processing, NLP) : 번역, 감정 분석, ChatGPT와 같은 챗봇 등
- 음성 인식(Speech Recognition) : 음성 명령 인식, 음성 텍트스 변환 등
- 추천 시스템(Recommendation Systems) : 사용자 맞춤형 컨텐츠 추천, 타겟팅 광고 등
- 의료 진단(Medical Diagnosis) :질병 예측, 영상 분석을 통한 진단 보조 등
📌 앞으로?
먼저 ML에 대한 포스팅도 계속해서 진행할 예정이고 DL의 전체적인 내용을 설명하며 각 분야에서 쓰는 방법론에 대해서도 포스팅 할 예정입니다.