[머신러닝/딥러닝 도서 Q&A] [혼공 머신러닝+딥러닝] p.253~p.254 랜덤서치에 대해

74 views
Skip to first unread message

손현철

unread,
Sep 3, 2021, 8:54:10 AM9/3/21
to 머신러닝/딥러닝 도서 Q&A
안녕하세요 랜덤 서치 부분에 궁금한 것이 생겨서 질문합니다.

rgen = randint(0, 10)
rgen.rvs(10)
0~10사이에서 10개의 정숫값을 추출한다고 알고있습니다.

궁금한 것이 
params = {'min_impurity_decrease': uniform(0.0001, 0.001),
          'max_depth': randint(20, 50),
          'min_samples_split': randint(2, 25),
          'min_samples_leaf': randint(1, 25),
          }

gs = RandomizedSearchCV(DecisionTreeClassifier(random_state=42), params, 
                        n_iter=100, n_jobs=-1, random_state=42)

n_iter 매개변수가 샘플링 횟수를 지정하는 것으로 이해했는데

1. rvs()메소드랑 n_iter랑 같은 의미인가요?

2. 각 매개변수마다 100개의 값을 추출하는 것인가요?? 아니면 모든 매개변수 합쳐서 100개의 값을 추출하는 것인가요? 

2. 1번의 질문이 맞다면 각 매개변수마다 100개의 값을 추출하면 매개변수가 4개이므로 100 * 100 * 100 * 100 * 5(5-폴드교차검증)개의 모델이 만들어지는 것인가요???

Haesun Park

unread,
Sep 3, 2021, 9:08:48 AM9/3/21
to 손현철, 머신러닝/딥러닝 도서 Q&A
안녕하세요. 박해선입니다.

n_iter 매개변수로 랜덤 서치의 반복 횟수를 지정합니다.
매회 반복에서 min_impurity_decrease, max_depth, min_samples_split, min_samples_leaf를 랜덤하게 선택합니다.
이 때 randint와 uniform 객체의 rvs 메서드를 사용해 랜덤한 값을 뽑습니다.
따라서 랜덤 서치는 총 100*5개의 모델이 만들어 집니다.

감사합니다.

2021년 9월 3일 (금) 오후 9:54, 손현철 <thsv...@gmail.com>님이 작성:
--
이 메일은 Google 그룹스 '머신러닝/딥러닝 도서 Q&A' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 ml-dl-book-qn...@googlegroups.com에 이메일을 보내세요.
웹에서 이 토론을 보려면 https://groups.google.com/d/msgid/ml-dl-book-qna/09a48c3b-6a07-46f5-b8b0-a0a4cf9497a6n%40googlegroups.com을(를) 방문하세요.
Reply all
Reply to author
Forward
0 new messages