안녕하세요 교수님 회귀분석과 관련해 질문 있습니다.

394 views

Skip to first unread message

wtja...@gmail.com

unread,

Jul 23, 2018, 2:03:11 AM7/23/18

to 통계상담Q&A그룹 : 한남대학교 권세혁교수

안녕하세요? 교수님

현재 대학에 재학중인 학생인데 회귀분석에 관해 궁금한 점이 있어 문의 남기게 됐습니다.

중회귀 분석 시
y=ax + bx1 + cx2 라는 회귀식이 도출됐다고 가정했을 때

a, b -> 즉 x와 x1에 대한 효과는 p<0.05로 유의하다
c -> x2의 효과는 p<0.05를 만족하지 못해 효과가 유의하지 않다
전체 회귀식 y -> p<0.05를 만족해 전체 회귀식은 유의하다라고 결과가 나왔다면

해당 회귀식을 믿고 사용해도 되는지요?
다시말해, 회귀식 자체는 유의한 p-value 값이 나왔는데 그 안에서 한 변수의 효과가 유의하지 않은 경우입니다.(단, 유의하지 않은 인자를 회귀식에서 소거하지 못하는 경우)
이럴경우 어떻게 해석해야 할까요?

중회귀 분석 시 x의 경우 연속형 데이터의 조건을 갖춰야 하는데 데이터가 한 수준에서 너무 많게 측정되었을 때

회귀분석이 가능한지요?

예를 들어 키와 몸무게에 관한 회귀식을 만들려 할 때,

위와 같은 데이터 구성일 때, 어떻게 데이터 전처리를 해야할 까요??

혹은 올바른 회귀분석의 데이터 실험 계획은 어떻게 될까요?? 한 수준에서 여러번 실험한는 것보다는 범위를 넓혀서 최대한 커버하는 실험이 맞을까요?

통계상담_한남대권세혁교수

unread,

Jul 23, 2018, 3:00:21 AM7/23/18

to 통계상담Q&A그룹 : 한남대학교 권세혁교수

답변

1) 질문내용대로 유의하지 않은 변수는 제외하고 회귀모형 추정을 다시 한 후

유의한 변수로 추정된 모형을 제시하는 것이 적절합니다.

만약 소거하지 못한 경우에는 질문에 적은대로 전채 회귀모형은 유의하였으며,

유의한 변수는 x, x1이라고 기술하면 됩니다.

유의한 두 변수 중 어느 것이 더 종속변수에 영향을 많이 미치는지는

표준화 회귀계수의 크기를 활용하여 설명하면 됩니다.

2) 회귀분석에서 설명변수의 동일한 값(위의 예제에서는 169cm(?), 170cm)에서 여러번 종속변수(몸무게) 관측이 되면

실험설계(분산분석) 측면에서 동일 실험조건의 반복과 같은 현상이 발생하여 오차 변동이 과다 추정됩니다.

이론적 설명은 간단한데,... 이런 경우에는 회귀분석, 분산분석을 동시에 실행하여 회귀 오차변동을 순수(pure)오차와 적합결여 (lack of fits) 오차변동으로 나누어

키에 대한 유의성 검정을 하면 됩니다.

그런데 위의 경우에는 모든 설명변수 값에서 2개 이상의 반복 관측이 일어난 것이 아니므로

169cm, 170cm 각각 평균 몸무게를 구하여 하나만 관특된 것처럼 데이터 분석을 하면 될 것 같습니다.

결론적으로는 설명변수 개별 값에 대하여 2개 이상의 종속변수 값이 관측되면 회귀모형의 오차변동을 나누어

적합결여(회귀직선) 유의성 검정을 하는 것이 적절합니다.

그리고 RSM(Response Surface Methodology 반응표면방법) 적용한 분석 방법을 권장합니다.