문돌이 존버/데이터 분석
2020. 9. 2.
핸즈온 머신러닝 2 복습하기(챕터 3: 분류)
오차 행렬(confusion matrix) 분류기의 성능을 평가하는 더 좋은 방법이다. 쉽게 말해 클래스 A의 샘플이 클래스 B로 분류된 횟수를 세는 것이다. 오차 행렬을 만들려면 실제 타깃과 비교할 수 있도록 먼저 예측값을 만들어야 한다. 테스트 세트로 예측을 만들 수 있지만 테스트 세트는 프로젝트의 맨 마지막에 사용되어야 한다. 대신 cross_val_predict() 함수를 사용하면 된다. from sklearn.model_selection import cross_val_predict y_train_pred = cross_val_predict(sgd_clf, X_train, y_train_5, cv=3) from sklearn.metrics import confusion_matrix confusio..