Machine Learning

[머신러닝] Random Forest(랜덤 포레스트)

Scarlett_C 2021. 10. 2. 13:55
728x90

* Random Forest

:전체 데이터의 일부를 샘플링한 서브 데이터를 이용해서 학습시킨 여러개의 결정트리의 예측값들간에 보팅을 통해 최종 출력값을 만들어내는 기법

 

- 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종

- 훈련 과정에서 구성한 다수의 결정트리로부터 분류 또는 평균 예측치(회귀 분석)를 출력함으로써 동작

 

728x90

Random Forest의 장, 단점

- 장점 : 일반적으로 안정적인 좋은성능을 발휘

           병렬처리를 이용해서 여러개의 트리를 한번에 학습 가능

- 단점 : 학습 시간이 상대적으로 오래걸림.

 

 

<Random Forest 구현 도구>

sklearn.ensemble.RandomForestClassifier #분류 문제에 사용
sklearn.ensemble.RandomForestRegressor	#회귀 문제에 사용

 

728x90