안녕하세요 교수님,
저는 천안에 있는 한국기술교육대학교 대학원 기술경영학과의 전일제 박사과정 생입니다.
저도 기술경영경제학회 회원이어서 최근 한 5년동안 학회에 빠짐없이 참석했었는데, 교수님의 연구실적 부분에 보니까 기술경영경제학회에도 발표를 하셨더군요,, 반갑습니다. 이번에 대학원생들끼리 연구방법론 관련하여 세미나를 하려고 준비중인데, 질문이 있어서 여쭙습니다.
evernote를 사용해서 교수님께서 운영하셨던 게시판의 글을 스크랩해 두었었는데요,, 관련해서 추가적인 질문을 올리고자합니다.
보통 종속변수가 사건계수이고, 0이 많이 포함되어 있는 경우 (예를들면 중소기업 샘플의 특허 등록 수, 약 70 %는 특허 등록수가 0인 경우)에는 음이항 회귀분석이나 포아송회귀분석을 사용해야 된다고 알고 있습니다.
제가 알고 싶은 것은 첫째, 과산포의 판단기준입니다.
VMR이 1보다 큰지, 혹은 The Pearson goodness‐of‐fit test results 의 유의수준이 0.05이하인지를 가지고 판단하면 되는지요?
둘째, 아래의 글에 의하면 무조건 기계적으로 판단할 문제는 아닌 것처럼 되어 있는데, 그렇다면 포아송회귀분석과 음이항회귀분석의 차이점은 무엇인지요? 비슷한 모형인데, 종속변수의 분포가 과산포일때는 음이항회귀분석을 과산포가 아닐 경우에는 포아송회귀분석을 사용하는 것이 좋다는 배경에 대해서 알고 싶습니다.
감사드립니다. 그럼 더운 여름날씨에 건강하십시오.
천안에서 박성근 올림
P.S 교수님의 멋진 홈페이지 감상을 잘 했습니다.. 저도 그렇게 인생을 "관리"하고 싶군요 ^^ ㅎㅎ
==============================================================================================
죄송하게도 서두가 길었습니다. 궁금한 것 질문 드리겠습니다.
현재 보행자교통사고 자료를 통계분석하고 있는데,
일반적으로 교통사고 data는 과분산되는 경향이 있는데,
제가 분석하는 자료 또한 히스토그램을 보면 과분산 경향을 보여서
음이항회귀분석으로 분석하였는데,
포아송이 아닌 음이항을 사용할 경우, 과분산계수(알파)를 보여줘서 과분산을 증명해야한다고 하는데,
제가 통계모형을 R로 분석하였는데,
1. R에서 음이항 분석할 경우 과분산계수(알파)값을 제시하여 과분산을 증명할 수 있는 방법이 있는지요?
2. 혹시 과분산계수를 산출하는 R 함수가 있는지요?
다시한번 교수님의 조언 부탁드립니다.
감사합니다.
무더운 폭염이 계속이지만 건강하십시요
2012.08.13 09:27:02 (*.247.53.47)
Wolfpack
감사합니다.
과분산(over spread)을 판단하는 VMR (Variance to Mean Ratio)는 분산을 변동으로 나눈 값이므로
R에서 함수를 이용하여 계산 가능합니다. VMR=var(ds$var)/mean(ds$var)
관심사건의 발생 회수에 관심이 있는 경우 사용되는
이항분포 (실험회수 n 일정)는 0<VMR<1, 포아송분포 (실험회수 무한)는 VMR=1입니다.
과분산, 즉 VMR>1인 분포는 음이항분포가 맞습니다.
그러나 음이항분포는 관심 사건이 r번 일어날 때까지 시행하는 회수이므로 과분산만으로
음이항분포를 적용할 수 있는 것은 아닙니다.
교통사고 건수는 일반적으로 포아송 분포를 가정합니다.
과분산이면 데이터를 로그 변환하여 정규분포 선형모형을 사용하시면 됩니다.
Best wishes,