로지스틱 회귀 다중 분류에서
4번째 샘플의 예측값은 Roach인데,
실제값은 Whitefish인 이유는 왜일까요?
print(lr.predict(test_scaled[:5])) # 예측
['Perch' 'Smelt' 'Pike' 'Roach' 'Perch']
['Perch' 'Smelt' 'Pike' 'Whitefish' 'Perch']
proba = lr.predict_proba(test_scaled[:5]) # 확률값 반환
print(np.round(proba, decimals=3))
[[0. 0.014 0.842 0. 0.135 0.007 0.003]
[0. 0.003 0.044 0. 0.007 0.946 0. ]
[0. 0. 0.034 0.934 0.015 0.016 0. ]
[0.011 0.034 0.305 0.006 0.567 0. 0.076] # 4번째 샘플의 확률값은 Roach가 가장 높음
[0. 0. 0.904 0.002 0.089 0.002 0.001]]
['Bream' 'Parkki' 'Perch' 'Pike' 'Roach' 'Smelt' 'Whitefish']