안녕하세요. 주성분 분석에 대해 질문 드립니다.

39 views
Skip to first unread message

Dotorimuk

unread,
Feb 4, 2023, 9:14:37 AM2/4/23
to 머신러닝/딥러닝 도서 Q&A
안녕하십니까. 혼공머신으로 잘 공부하고 있습니다.

오늘 주성분 분석 파트까지 마쳤는데, 앞 부분은 혼자서 이해하기에 문제가 없었는데
비지도 학습 파트는 생각보다 높은 수준의 수학 지식, 파이썬 지식이 필요하네요.
특히 주성분 분석에 대해서 몇 가지 질문 드리고자 합니다.

1.(p.321)
주성분 분석 소개 중 네번째 삽화에서, S(4, 2)를 수직으로 투영한다는 것은 이해했는데,
점 p(4.5)의 4.5라는 값은 예를 들어 벡터의 길이가 10이라고 했을 때 4.5에 해당하는 지점이라고 이해해도 될까요? 어떻게 4.5라는 값이 나온 건지 궁금합니다.

2. (p.328)
삽화에서 선으로 표현되는 벡터는 주성분들의 집합으로 이해하면 될 것 같습니다.
하지만 328쪽을 보면, pca.n_components_로 찾은 2개의 특성이 잘 와닿지 않습니다.
원본 데이터는 10000개의 픽셀로 10000개의 특성이 있었는데, 단 두 개의 특성이 10000개의 특성을 대체해준다는 것이 쉽사리 이해가 되질 않습니다.

※ 그리고 비지도학습 장에서 사용하는 fruits 데이터를 불러오면, 책에서 소개하는 순서와는 다르게 타깃값 기준으로 0=사과, 1=파인애플, 2=바나나가 되는 게 아니라 0=파인애플, 1=바나나, 2=사과 이렇게 순서가 뒤틀리네요. 왜 그럴까요?

질문은 여기까지입니다. 내용이 길고 많은데, 천천히 답변해주시면 감사드리겠습니다.
책 정말 잘 읽고 있습니다. 감사합니다.

Dotorimuk

unread,
Feb 4, 2023, 9:16:53 AM2/4/23
to 머신러닝/딥러닝 도서 Q&A
PS. 교과과정 삭제로 행렬과 벡터에 대해서는 혼공머신으로 처음 접합니다 ㅠㅠ

2023년 2월 4일 토요일 오후 11시 14분 37초 UTC+9에 Dotorimuk님이 작성:

Haesun Park

unread,
Feb 5, 2023, 5:14:52 AM2/5/23
to Dotorimuk, 머신러닝/딥러닝 도서 Q&A
안녕하세요. 박해선입니다.
문의하신 내용에 답변 드립니다.
1. 4.5는 원점에서 P 점까지의 거리입니다. 4.5란 값은 예를 들기 위한 임의의 값입니다.
2. 삽화에 나오는 선분은 하나의 주성분에 해당합니다.
3. 304, 306페이지 설명을 참고하세요.
감사합니다!

2023년 2월 4일 (토) 오후 11:14, Dotorimuk <chhy...@gmail.com>님이 작성:
--
이 메일은 Google 그룹스 '머신러닝/딥러닝 도서 Q&A' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 ml-dl-book-qn...@googlegroups.com에 이메일을 보내세요.
웹에서 이 토론을 보려면 https://groups.google.com/d/msgid/ml-dl-book-qna/a3ee49a9-2c7b-44c4-b37c-f037b5df28c8n%40googlegroups.com을(를) 방문하세요.
Reply all
Reply to author
Forward
0 new messages