안녕하십니까. 혼공머신으로 잘 공부하고 있습니다.
오늘 주성분 분석 파트까지 마쳤는데, 앞 부분은 혼자서 이해하기에 문제가 없었는데
비지도 학습 파트는 생각보다 높은 수준의 수학 지식, 파이썬 지식이 필요하네요.
특히 주성분 분석에 대해서 몇 가지 질문 드리고자 합니다.
1.(p.321)
주성분 분석 소개 중 네번째 삽화에서, S(4, 2)를 수직으로 투영한다는 것은 이해했는데,
점 p(4.5)의 4.5라는 값은 예를 들어 벡터의 길이가 10이라고 했을 때 4.5에 해당하는 지점이라고 이해해도 될까요? 어떻게 4.5라는 값이 나온 건지 궁금합니다.
2. (p.328)
삽화에서 선으로 표현되는 벡터는 주성분들의 집합으로 이해하면 될 것 같습니다.
하지만 328쪽을 보면, pca.n_components_로 찾은 2개의 특성이 잘 와닿지 않습니다.
원본 데이터는 10000개의 픽셀로 10000개의 특성이 있었는데, 단 두 개의 특성이 10000개의 특성을 대체해준다는 것이 쉽사리 이해가 되질 않습니다.
※ 그리고 비지도학습 장에서 사용하는 fruits 데이터를 불러오면, 책에서 소개하는 순서와는 다르게 타깃값 기준으로 0=사과, 1=파인애플, 2=바나나가 되는 게 아니라 0=파인애플, 1=바나나, 2=사과 이렇게 순서가 뒤틀리네요. 왜 그럴까요?
질문은 여기까지입니다. 내용이 길고 많은데, 천천히 답변해주시면 감사드리겠습니다.
책 정말 잘 읽고 있습니다. 감사합니다.