데이터 전처리 과정에서 궁금한 부분이 있습니다.

8 views
Skip to first unread message

아편밀매꾼

unread,
Jan 13, 2023, 4:12:19 AM1/13/23
to 머신러닝/딥러닝 도서 Q&A
p 158, 159 부분에서 데이터를 polynomialfeatures를 사용해 특성을 늘려주고, standardscale사용해 표준화하는 것과, 순서를 바꿔 표준화를 먼저 해주고, polynomialfeatures를 사용해 특성을 늘려주는 것과 차이가 있나요? 
제가 직접 해보고 테스트 데이터로 score를 확인해 보니까 음수가 나오는 건 똑같은데, 후자가 더 음수값이 크더라고요... 또한 테스트 데이터중 하나를 predict를 이용해 예측값을 확인해 봤는데, 예측값도 다르더라고요 이건 전자가 타겟과 가까운 값을  예측했어요.

Haesun Park

unread,
Jan 13, 2023, 6:55:14 PM1/13/23
to 아편밀매꾼, 머신러닝/딥러닝 도서 Q&A
안녕하세요. 박해선입니다.
표준화를 먼저 수행하고 다항 특성을 만들면 새로 만들어진 특성들은 정규화가 되지 않게 됩니다.
일반적으로 특성을 만들고 난 후 표준화를 합니다. 하지만 정해진 규칙 같은 것은 없는 것 같습니다. :)
감사합니다!

2023년 1월 13일 (금) 오후 6:12, 아편밀매꾼 <dlgu...@gmail.com>님이 작성:
p 158, 159 부분에서 데이터를 polynomialfeatures를 사용해 특성을 늘려주고, standardscale사용해 표준화하는 것과, 순서를 바꿔 표준화를 먼저 해주고, polynomialfeatures를 사용해 특성을 늘려주는 것과 차이가 있나요? 
제가 직접 해보고 테스트 데이터로 score를 확인해 보니까 음수가 나오는 건 똑같은데, 후자가 더 음수값이 크더라고요... 또한 테스트 데이터중 하나를 predict를 이용해 예측값을 확인해 봤는데, 예측값도 다르더라고요 이건 전자가 타겟과 가까운 값을  예측했어요.

--
이 메일은 Google 그룹스 '머신러닝/딥러닝 도서 Q&A' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 ml-dl-book-qn...@googlegroups.com에 이메일을 보내세요.
웹에서 이 토론을 보려면 https://groups.google.com/d/msgid/ml-dl-book-qna/39f882ed-5b05-4a0d-949f-f15cba41c881n%40googlegroups.com을(를) 방문하세요.
Reply all
Reply to author
Forward
0 new messages