문돌이 존버/데이터 분석
2021. 6. 17.
핸즈온 머신러닝 2 복습하기(챕터 8: 차원 축소)
CH 8. 차원 축소 많은 경우 머신러닝 문제는 훈련 샘플 각각이 수천 심지어 수백만 개의 특성을 가지고 있다. 이는 훈련을 느리게 하고 좋은 솔루션을 찾기 힘든데, 이를 차원의 저주(curse of dimensionality)라고 한다. 차원을 축소시키면 일부 정보가 유실될 수 밖에 없어, 훈련 속도는 빨라지지만 시스템 성능이 조금 나빠질 수 있다는 양면성이 존재한다. 따라서 차원 축소를 실행하기 전 훈련이 너무 느린지 원본 데이터로 시스템을 훈련시켜봐야 한다. (주의) 차원이 축소된다고 해서 언제나 학습 시간을 줄여주는 것은 아니다. 데이터셋, 알고리즘, 모델에 따라 상황이 달라진다. 8.2.1 투영 대부분의 실전 문제는 훈련 샘플이 모든 차원에 걸쳐 균일하게 퍼져 있지 않다. 많은 특성은 거의 변화..