안녕하세요. 현재 석사과정에 있는 대학원생입니다. 제가 연구하고 있는 분야에서 음이항회귀분석이 많이 사용되고 있지 않는 분야라서 여쭤보고자합니다.
독립변수가 10개(상품종류(범주형), 가격, 리뷰 길이, 가격 등이 있고, 조절변수로는 사용시간, 종속변수에는 유용성 투표로 하려고 합니다.
종속변수인 유용성 투표가 포아송 분포를 보이고, 분산이 평균보다 크고, 0이 많아서 0과잉 음이항회귀분석을 사용하려고 합니다.
궁금한점으로,
1. 음이항회귀분석 가정인 분산이 평균보다 크다와 포아송 분포를 가지는 것이 종속변수에만 해당하는 것인지 독립변수, 조절변수까지 다 포함하는 것인지 궁금합니다.
2. 조절효과를 보기 위해서는 다중회귀분석에서 조절효과를 보는 것과 같이, 1. 독립 변수만 2. 독립+조절변수 3. 독립+조절+상호작용항 이러한 순으로 비교를 하면 되는 건지 궁금합니다.
3. 2번에서 상호작용항(독립x조절)을 투입할 때 다중공선성을 방지하기 위해 Centering을 하고 넣어야하는 지 궁금합니다.
4. R로 분석을 진행중인데 2번과 같은 순서로 진행을 할때, AIC만으로 모델 설명력을 알면 되는지 궁금합니다.
항상 좋은 답변과 정보 감사드립니다.