최근접 이웃
- 작은 데이터셋일 경우, 기본 모델로서 좋고 설명하기 쉬움.
선형 모델
- 첫 번째로 시도할 알고리즘.
- 대용량 데이터셋 가능.
- 고차원 데이터에 가능.
나이브 베이즈
- 분류만 가능.
- 선형 모델보다 훨씬 빠름.
- 대용량 데이터셋과 고차원 데이터에 가능.
- 선형 모델보다 덜 정확함.
결정 트리
- 매우 빠름.
- 데이터 스케일 조정이 필요 없음.
- 시각화하기 좋고 설명하기 쉬움.
랜덤 포레스트
- 결정 트리 하나보다 거의 항상 좋은 성능을 냄.
- 매우 안정적이고 강력함.
- 데이터스케일 조정 필요 없음.
- 고차원 희소 데이터에는 잘 안맞음.
그래디언트 부스팅 결정 트리
- 랜덤 포레스트보다 조금 더 성능이 좋음.
- 랜덤 포레스트보다 학습은 느리나 예측은 빠르고 메모리를 조금 사용.
- 랜덤 포레스트보다 매개변수 튜닝이 많이 필요함.
서포트 벡터 머신
- 비슷한 의미의 특성으로 이뤄진 중간 규모 데이터셋에 잘 맞음.
- 데이터 스케일 조정 필요.
- 매개변수에 민감.
신경망
- 특별히 대용량 데이터셋에서 매우 복잡한 모델을 만들 수 있음.
- 매개변수 선택과 데이터 스케일에 민감.
- 큰 모델은 학습이 오래 걸림.
'Programming > Machine Learning' 카테고리의 다른 글
특성 자동 선택 (0) | 2020.02.15 |
---|---|
스케일 조정 (0) | 2020.02.15 |
결정 트리 (0) | 2020.02.15 |
선형모델 (0) | 2020.02.14 |
K-NN 분류 알고리즘 (0) | 2020.02.14 |