AI/LG Aimers

[LG Aimers 교육] Module.2 지도학습 -Part1. SL Foundation

Opti-Mr 2022. 7. 8. 23:32
반응형

Machine Learning의 한 부류인 지도학습(Supervised Learning)에 대한 기본 개념과 regression/classification의 목적 및 차이점에 대해 이해하고, 다양한 모델 및 방법론(linear and nonlinear regression, classification, ensemble methods, kernel methods 등)을 통해 언제 어떤 모델을 사용해야 하는지, 왜 사용하는지, 모델 성능을 향상시키는 방법을 학습한다.

이화여자대학교 강제원교수님

이미지 비디오, 3차원데이터 등 미디어를 구성하는 여러가지 데이터에 대한 인공지능 알고리즘을 연구

사람과 기계의 소통을 매개로 하는 미디어에 대한 연구

Supervised Learning : 인공지능 모델의 정답과 학습방법을 알려줌

기본개념과 원리

Machine Lerning 데이터로부터 내재된 패턴을 학습하는 과정

스팸메일 구분,  Image Recognition문제 : 입력이미지를 이용해서 어떤 동물인지 분류하는 문제

                                  ↑ Deep Learning 연구가 컴퓨터비전에서 우수한 역할을 함

 

Machine Learning 

1. Supervised Learning (데이터의 label이 있음)

 입력 X → 출력 Y(=정답=label)

이미지 이미지 label

- Regression 회귀 : 출력이 연속변수

- Classification 분류: 출력이 이산변수

2. Unsuperviesed Learning

 

Supervised Learning 도식화

1. model training

ML model이 dataset의 lable을 통해 정답을 학습

model output과 정답값의 차이=error

2. model test

입력 샘플은 trainig sample/test sample로 나뉨

예시) 다양한 종류의 차량을 입력했을 때 이 차가 Family차량인지 구분하는 것

풀고자하는 문제에 대한 지식을 가져야 효과적인 feature를 디자인할 수 있음.

Learning model

Goal = f : X → Y

Training set D=x,y ...

Learning model

1. Feature selection

2. Model selection : 풀고자하는 문제에 가장 적합한 모델 선택

3. Optimization : 모델 parameter 최적화하여 모델이 가장 우수한 성능을 제공하도록 함

Hypothesis : g ~~ f

 

Model generalization

 = set Goal

Generalization error Egen; 

지도학습에서는 training error, validation , test error를 통해 에러를 최소화하기위해 노력함

 

Errors

- squared error : 모델이 출력한 값- 정답

-binary error : 내부 로직이 맞으면 0 틀리면 1

= 두개 더해서 overall errors E[squared error^2]

Etrain : 모델을 주어진 data set에 맞춰 학습하는 데 사용하는 에러

Etest : 테스트할 때 에러

목표 : Etest~Egen~0에 근사

1. Etest~Egen

 실패원인 : 과적합문제 = 높은 variance 변동량

 대안 : Regularization, Ensemvle 

2. Etrain~0

 실패원인 : underfitting = 높은 bias 편차

 대안 : 표준화

 

모델의 정확도가 높아질수록

1. bias 낮아짐

2. model 일반성 높아짐

3. variance 낮아짐

그러므로 bias와 variance는 trade off관계라고 할 수 있음

 

 

 

반응형