안녕하세요 권세혁 교수님,
서울대학교 석사 논문을 작성하고 있는 정성지입니다.
제가 초등학생을 대상으로 약 975개의 표본을 코딩하여 분석을 하는 중에
종속변인이 정규성이 확보가 되지 않아서 질문을 드리고자 합니다.
종속변인은
지식을 측정하는 것으로, 한 문장에 대하여(맞을 수도 있고, 틀릴 수도 있는)
옳다(1), 아니다(2), 모른다(3)의 응답 가운데 맞은 것만을 합산으로 취하는 형식입니다.
따라서 0에서 32점 만점까지 분포될 수 있습니다.
먼저 박스플롯으로 확인한 결과, 10점 이하인 ID들은 결측치로 확인이 되어서
다 삭제를 해놓았습니다.
그리고서 정규성 확인을 위하여
히스토그램과 pp plot, qq plot, kolmogorov-smirnov, shapiro-wilk 검정을 살펴보았습니다.
먼저 히스포그램은 부적 편포(오른쪽으로 치우침)를 보이고,
pp plot은 사선 가까이에 있는 것으로 나타납니다.
qq plot은 일직선에 가깝지는 않고, 어떤 데이터의 경우에는 정규 편차가 극도로 먼 것으로(-1.2) 나타납니다.
무엇보다 kolmogorov-smirnov, shapiro-wilk 검정에서는 두개다 모두 유의확률이 .000으로 나와서
정규성이 보장되지 않는 것으로 나오는데,
아무리
로그변환, 루트스퀘어변환, 자연로그변환 등을 사용해도 정규성 변환이 되지 않는다면,
이 데이터로 논문을 사용할 수 없는 것일까요ㅠ
혹시 데이터가 필요하시다면 보내드릴 수 있습니다.
제 종속변인이 정규성이 가정되지 않는 상황이어서 분석을 진행할 수 없는 상태입니다.
답변 부탁드리겠습니다.ㅠㅠㅠㅠㅠㅠㅠ
감사합니다.