[혼자 공부하는 머신러닝+딥러닝] 3-3 질문입니다.

16 views
Skip to first unread message

준혁

unread,
Dec 19, 2022, 8:55:35 PM12/19/22
to 머신러닝/딥러닝 도서 Q&A
159p에서 '규제 전에 스케일 표준화'에 대한 내용이 복잡해서
 이해한 내용이 맞는지 확인차 여쭤봅니다..!

1) 해당 주차 유튜브 강의에서 '원래 선형회귀는 해석적인 방법으로 계산하기 때문에 스케일을 따로 안 맞춰도 상관없었다. 하지만 규제를 하게되면 말이 달라진다'고 하셨습니다.

2) 그 말씀과 교재 내용을 합쳐서 아래와 같이 이해했습니다.

원래 선형회귀는 각각의 계수를 해석(ex. 길이가 1만큼 증가할 때 무게는 ~만큼 증가한다)하는 방식으로 결론을 도출하기 때문에 각각의 척도를 존중해주어도 상관이 없다 
-> 그런데 '규제'는 과도한 기울기(가중치)에 벌칙을 가하는 방식으로 적용된다. 쉽게 말해, 너무 높은 계수가 있으면 그 계수를 줄여버린다.
-> 그런데 이 '높은' 계수를 판단할 때, 특성마다 스케일이 다르면 <얼마 이상이면 높은지에 대한 기준>을 수치화할 수 없다. (ex. <10 이상이면 높다>고 기준을 세웠을 때, 길이가 1m인 경우 규제대상이 아니지만, 그걸 100cm로 스케일을 달리하면 규제대상이 되어버린다)
-> 따라서, 이런 척도를 모두 통일해준 뒤에, '규제'를 취해야 한다! 

혹시 이러한 사고흐름에서 조금이라도 잘못된 부분이 있다면 짚어주시면 감사하겠습니다!

Haesun Park

unread,
Dec 29, 2022, 2:03:20 AM12/29/22
to 준혁, 머신러닝/딥러닝 도서 Q&A
안녕하세요. 박해선입니다.
사이킷런의 LinearRegression 클래스는 해석적인 방법으로 해를 구합니다.
Ridge와 Lasso는 이와 다르며 특성을 전처리해야 합니다.
감사합니다!

2022년 12월 20일 (화) 오전 10:55, 준혁 <simon...@gmail.com>님이 작성:
--
이 메일은 Google 그룹스 '머신러닝/딥러닝 도서 Q&A' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 ml-dl-book-qn...@googlegroups.com에 이메일을 보내세요.
웹에서 이 토론을 보려면 https://groups.google.com/d/msgid/ml-dl-book-qna/4fb72119-881e-474b-a555-e7c78eea6b9en%40googlegroups.com을(를) 방문하세요.
Reply all
Reply to author
Forward
0 new messages