안녕하세요. 박해선입니다.
<핸즈온 머신러닝 2판>, <GAN 인 액션>에 에러타가 추가되었습니다.
또 <(개정판) 파이썬 라이브러리를 활용한 머신러닝>에 사이킷런 0.23 버전을 반영한 주석이 추가되어 안내해 드립니다.
<핸즈온 머신러닝 2판>
47. (p326) 위에서 2번째 줄에 “열을 k 개 가진 행렬”을 “k 개 열을 가진 행렬”로 수정합니다.
48. (p391) 48번 주석을 다음과 같이 바꿉니다. “옮긴이_ save() 메서드는 기본적으로 SavedModel 포맷으로 저장합니다. 파일의 확장자가 ‘.h5’이거나 save_format 매개변수를 ‘h5’로 지정하면 HDF5 포맷을 사용합니다.”
<GAN 인 액션>36. (p41) In[15] 바로 위 문장 끝에 다음 주석을 추가합니다. “옮긴이_ 사이킷런 0.23 버전부터 dataset모듈의 함수에서 as_frame=True와 같이 지정하면 데이터프레임으로 반환됩니다.”37. (p108) 41번 주석을 다음과 같이 변경합니다.옮긴이_ graphviz 모듈은 conda install graphviz 또는 pip install graphviz 명령으로 설치할 수 있습니다. 주피터 노트북이 아닐 경우 graphviz.Source의 결과를 변수로 저장하여 pdf, png 등의 파일로 저장할 수 있습니다.dot=graphviz.Source(dot_graph)
dot.format='png'
dot.render(filename='tree.png')
사이킷런 0.21 버전에서 추가된 plot_tree() 함수를 사용하면 .dot 파일을 만들지 않고 바로 트리를 그릴 수 있습니다. 이 함수는 export_graphviz() 함수에서 사용한 class_names, feature_names, impurity, filled 매개변수를 모두 지원합니다.
38. (p125) 주석 52번을 다음과 같이 변경합니다. “옮긴이_ xgboost(https://xgboost.readthedocs.io/)는 대용량 분산 처리를 위한 그레이디언트 부스팅 오픈 소스 라이브러리로 C++, 파이썬, R, 자바 등 여러 인터페이스를 지원합니다. 히스토그램 기반 부스팅 알고리즘을 사용하는 또 다른 인기 라이브러리는 마이크로소프트에서 만든 LightGBM(https://lightgbm.readthedocs.io/)입니다. 사이킷런 0.21 버전에서도 이와 비슷한 HistGradientBoostingClassifier와 HistGradientBoostingRegressor 클래스가 추가되었습니다.”39. (p193) Out[13] 바로 아래 첫 번째 문장 끝에 다음 주석을 추가합니다. “옮긴이_ 중요한 전처리 작업 중 하나는 누락된 값의 처리입니다. 사이킷런에서는 특성의 평균이나 최빈값으로 대체하는 SimpleImputer 클래스(0.20 버전에서 추가)와 최근접 이웃 방식으로 대체하는 KNNImputer 클래스(0.22 버전에서 추가) 등을 제공합니다.”40. (p372) 첫 번째 문장 끝에 다음 주석을 추가합니다.옮긴이_ 사이킷런 0.22 버전에서 정밀도-재현율 곡선을 그려주는 함수가 추가되었습니다. 예를 들어 다음 코드는 In [61]에 있는 svc 추정기를 사용해 [그림 5-13]과 유사한 그래프를 그립니다.from sklearn.metrics import plot_precision_recall_curve
plot_precision_recall_curve(svc, X_test, y_test)
plt.show()
41. (p377) 첫 번째 문장 끝에 다음 주석을 추가합니다.옮긴이_ 사이킷런 0.22 버전에서 ROC 곡선을 그려주는 함수가 추가되었습니다. 예를 들면 다음과 같이 사용합니다.from sklearn.metrics import plot_roc_curve
plot_roc_curve(svc, X_test, y_test)
plt.show()
42. (p382) In[70] 바로 위 문장 끝에 다음 주석을 추가합니다.옮긴이_ 사이킷런 0.22 버전에서 오차 행렬을 그래프로 그려주는 함수가 추가되었습니다. 예를 들면 다음과 같이 사용합니다.from sklearn.metrics import plot_confusion_matrix
plot_confusion_matrix(lr, X_test, y_test)
plt.show()
43. (p401) 11번 주석 끝에 다음 내용을 추가합니다.사이킷런 0.23 버전에서는 추정기 객체를 주피터 노트북에서 시각화해주는 기능이 추가되었습니다. 특히 이 기능은 파이프라인 구조를 잘 요약해주기 때문에 유용합니다. 예를 들어 다음 코드는 [그림 6-3]의 pipe 객체의 구조를 출력합니다.from sklearn import set_config
set_config(display='diagram')
pipe
감사합니다.