[혼공머신] 229페이지 결정트리 테스트 조건

Dc Lee

unread,

May 29, 2021, 1:12:02 AM5/29/21

to 머신러닝/딥러닝 도서 Q&A

안녕하세요,

혼공머신 229페이지 맨위의 그림에서 결정트리의 그림이 담고 있는 정보에 대한 설명이 있고 가장위의 정보가 '테스트 조건'이라고 되어있습니다.

그 아래의 그림을 보면 루트 노드의 테스트 조건에 'sugar <= -0.239'라고 되어있는데요, 결정트리모델은 이러한 테스트 조건을 어떻게 생성하나요?

예를 더 직관적으로 드리면,

234페이지의 숫자를 사용하면, 루트노드의 테스트 조건은 'sugar <= 4.325' 입니다.

이는 223페이지의 상단에 wine.describe()의 결과를 봤을때, 슈가하는 특성의 평균 또는 1사분위, 2사분위,3사분위 값도 아닙니다. 그렇다면, 어떤 기준으로 어떻게 테스트 조건이 생성이 되나요?

Haesun Park

unread,

May 29, 2021, 3:20:06 AM5/29/21

to Dc Lee, 머신러닝/딥러닝 도서 Q&A

안녕하세요. 박해선입니다.

230~231 페이지에 노드 분할 기준에 대해 설명하고 있습니다.

결정 트리는 노드를 나누었을 때 불순도가 최대가 되는 기준을 찾습니다.

감사합니다.

2021년 5월 29일 (토) 오후 2:12, Dc Lee <namu04...@gmail.com>님이 작성:

--
이 메일은 Google 그룹스 '머신러닝/딥러닝 도서 Q&A' 그룹에 가입한 분들에게 전송되는 메시지입니다.
이 그룹에서 탈퇴하고 더 이상 이메일을 받지 않으려면 ml-dl-book-qn...@googlegroups.com에 이메일을 보내세요.
웹에서 이 토론을 보려면 https://groups.google.com/d/msgid/ml-dl-book-qna/58668430-d4d7-479f-b7f0-cc24b4c1781cn%40googlegroups.com을(를) 방문하세요.

Dc Lee

unread,

May 29, 2021, 5:58:12 AM5/29/21

to Haesun Park, 머신러닝/딥러닝 도서 Q&A

안녕하세요,

230~231페이지에서는 '불순도 기준을 사용해 정보 이득이 최대가 되도록 분할합니다'라고 되어있는데요,

구체적으로 또는 직관적으로 어떻게 정보이득이 촤대가 되도록 찾아서 아래의 예처럼 sugar <= 4.325라는 테스트 조건이 나오게 되는건가요?

감사합니다

On May 29, 2021, at 3:20 PM, Haesun Park <haesu...@gmail.com> wrote:

Haesun Park

unread,

May 29, 2021, 7:03:04 AM5/29/21

to Dc Lee, 머신러닝/딥러닝 도서 Q&A

안녕하세요. 박해선입니다.

정보 이득을 최대화하는 지점을 찾는 것은 라이브러리마다 다릅니다.

사이킷런 라이브러리의 노드 분할 구현은 깃허브에서 splitter 클래스를 참고해 주세요.

https://github.com/scikit-learn/scikit-learn/blob/main/sklearn/tree/_splitter.pyx

감사합니다.

2021년 5월 29일 (토) 오후 6:58, Dc Lee <namu04...@gmail.com>님이 작성:

Dc Lee

unread,

May 29, 2021, 8:36:23 AM5/29/21

to Haesun Park, 머신러닝/딥러닝 도서 Q&A

안녕하세요,

아래의 유투브 동영상 14분부터 설명이 나와있어서 이해가 되었습니다.

https://youtu.be/7VeUPuFGJHk

감사합니다

Haesun Park

unread,

May 29, 2021, 10:01:10 AM5/29/21

to Dc Lee, 머신러닝/딥러닝 도서 Q&A

안녕하세요. 박해선입니다.

궁금증이 풀리셨다니 다행이네요. :)

감사합니다.

2021년 5월 29일 (토) 오후 9:36, Dc Lee <namu04...@gmail.com>님이 작성:

Reply all

Reply to author

Forward