Machine Learning
[머신러닝] Random Forest(랜덤 포레스트)
Scarlett_C
2021. 10. 2. 13:55
728x90
* Random Forest
:전체 데이터의 일부를 샘플링한 서브 데이터를 이용해서 학습시킨 여러개의 결정트리의 예측값들간에 보팅을 통해 최종 출력값을 만들어내는 기법
- 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종
- 훈련 과정에서 구성한 다수의 결정트리로부터 분류 또는 평균 예측치(회귀 분석)를 출력함으로써 동작
728x90
Random Forest의 장, 단점
- 장점 : 일반적으로 안정적인 좋은성능을 발휘
병렬처리를 이용해서 여러개의 트리를 한번에 학습 가능
- 단점 : 학습 시간이 상대적으로 오래걸림.
<Random Forest 구현 도구>
sklearn.ensemble.RandomForestClassifier #분류 문제에 사용
sklearn.ensemble.RandomForestRegressor #회귀 문제에 사용
728x90