본문 바로가기

Programming/Machine Learning

머신러닝 모델 - 간단한 요약

최근접 이웃

- 작은 데이터셋일 경우, 기본 모델로서 좋고 설명하기 쉬움.

 

선형 모델

- 첫 번째로 시도할 알고리즘.

- 대용량 데이터셋 가능.

- 고차원 데이터에 가능.

 

나이브 베이즈

- 분류만 가능.

- 선형 모델보다 훨씬 빠름.

- 대용량 데이터셋과 고차원 데이터에 가능.

- 선형 모델보다 덜 정확함.

 

결정 트리

- 매우 빠름.

- 데이터 스케일 조정이 필요 없음.

- 시각화하기 좋고 설명하기 쉬움.

 

랜덤 포레스트

- 결정 트리 하나보다 거의 항상 좋은 성능을 냄.

- 매우 안정적이고 강력함.

- 데이터스케일 조정 필요 없음.

- 고차원 희소 데이터에는 잘 안맞음.

 

그래디언트 부스팅 결정 트리

- 랜덤 포레스트보다 조금 더 성능이 좋음.

- 랜덤 포레스트보다 학습은 느리나 예측은 빠르고 메모리를 조금 사용.

- 랜덤 포레스트보다 매개변수 튜닝이 많이 필요함.

 

서포트 벡터 머신

- 비슷한 의미의 특성으로 이뤄진 중간 규모 데이터셋에 잘 맞음.

- 데이터 스케일 조정 필요.

- 매개변수에 민감.

 

신경망

- 특별히 대용량 데이터셋에서 매우 복잡한 모델을 만들 수 있음.

- 매개변수 선택과 데이터 스케일에 민감.

- 큰 모델은 학습이 오래 걸림.

'Programming > Machine Learning' 카테고리의 다른 글

특성 자동 선택  (0) 2020.02.15
스케일 조정  (0) 2020.02.15
결정 트리  (0) 2020.02.15
선형모델  (0) 2020.02.14
K-NN 분류 알고리즘  (0) 2020.02.14