728x90
* Random Forest
:전체 데이터의 일부를 샘플링한 서브 데이터를 이용해서 학습시킨 여러개의 결정트리의 예측값들간에 보팅을 통해 최종 출력값을 만들어내는 기법
- 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종
- 훈련 과정에서 구성한 다수의 결정트리로부터 분류 또는 평균 예측치(회귀 분석)를 출력함으로써 동작
728x90
Random Forest의 장, 단점
- 장점 : 일반적으로 안정적인 좋은성능을 발휘
병렬처리를 이용해서 여러개의 트리를 한번에 학습 가능
- 단점 : 학습 시간이 상대적으로 오래걸림.
<Random Forest 구현 도구>
sklearn.ensemble.RandomForestClassifier #분류 문제에 사용
sklearn.ensemble.RandomForestRegressor #회귀 문제에 사용
728x90
'Machine Learning' 카테고리의 다른 글
[머신러닝] 최적화 알고리즘 - 경사하강법(Gradient Descent) (0) | 2021.10.20 |
---|---|
[머신러닝] Integer Encoding & One-hot Encoding (0) | 2021.10.02 |
[머신 러닝] Regression 알고리즘 (0) | 2021.09.02 |
[머신 러닝] 머신러닝 성능향상 - Feature Engineering (0) | 2021.09.02 |
[머신 러닝] 상관분석(Correlation Analysis) (0) | 2021.09.01 |