문돌이 존버/데이터 분석
2020. 11. 14.
핸즈온 머신러닝 2 복습하기(챕터 5: 서포트 벡터 머신)
CH 5. 서포트 벡터 머신 선형 SVM 분류 서포트 벡터 머신(SVM, support vector machine)은 선형이나 비선형 분류, 회귀, 이상치 탐색에 사용할 수 있는 다목적 머신러닝 모델이다. SVM 분류기를 클래스 사이에 가장 폭이 넓은 도로를 찾는 것으로 생각할 수 있는데, 따라서 라지 마진 분류(large margin classification)라고도 한다. 아래 오른쪽 그림의 실선이 마진이 가장 큰 경우이다. 마진이 가장 큰 경우를 찾는 것이 중요한 이유는 새로운 샘플이 들어왔을 때 영향을 적게 받기 때문이다. 다시 말해, 위그림의 실선은 실선 주변에 위치한 샘플(=서포트 백터)에 의해 전적으로 결정된다는 의미다. 또한, SVM은 특성 스케일에도 민감하여 사이킷런의 StandardSc..