안녕하세요 선생님. Chapter 02-1(훈련 세트와 테스트 세트)를 공부하면서 제가 훈련 세트를 잘 이해했는지 알고싶습니다. 아래의 내용은 제가 이해한 것을 바탕으로 작성했습니다.
a라는 데이터를 훈련 세트와 테스트 세트로 나눈다. 이때, 훈련 세트는 모델을 학습시키기 위한 데이터이고 테스트 세트는 모델이 일반화한 능력을 평가하기 위한 데이터이다.
```
kn = KNeighborsClassifier() #모델 생성
kn.fit(train_input, train_target) #모델 훈련
kn.score(train_input, train_target) #모델 평가, 실행 결과 1.0 출력
```
위의 코드를 요약하면 훈련 세트로 모델을 훈련하고 평가했고 정확도가 1.0이 출력된 거잖아요. 모델의 성능이 좋은지 알아보기 위해서는 기존의 데이터(훈련 세트)뿐만 아니라 새로운 데이터(테스트 세트)로 평가할 때에도 정확도가 높아야 하고요. 그래서 테스트 세트로 모델(훈련 세트로 평가한 모델 kn)을 평가합니다.
`kn.score(test_input, test_target) #모델 평가, 실행 결과 1.0 출력`
실행 결과 1.0이 나왔다는 것은 새로운 데이터(테스트 세트)에서도 정확도가 매우 높다는 것으로 즉 모델 일반화가 잘 되었다.
로 이해하면 될까요?