문돌이 존버/데이터 분석
2021. 6. 18.
핸즈온 머신러닝 2 복습하기(챕터 7: 앙상블 학습과 랜덤 포레스트)
일련의 예측기(분류나 회귀 모델)로부터 예측을 수집하면 가장 좋은 모델 하나보다도 더 좋은 예측을 얻을 수 있다. 이를 앙상블 학습(Ensemble Learning)이라 하며, 의사결정나무의 앙상블을 랜덤 포레스트(Random Frest)라고 한다. 7.1 투표 기반 분류기 더 좋은 분류기를 만드는 매우 간단한 방법은 각 분류기의 예측을 모아서 가장 많이 선택된 클래스를 예측하는 것이다. 이렇게 다수결 투표로 정해지는 분류기를 직접 투표(hard voting) 분류기라고 한다. 이때 필요한 가정은 모든 분류기가 완벽하게 독립적이고 오차에 상관관계가 없어야 한다는 것이다. from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble i..