다중회귀모형 종속/독립변수 로그변환시 처리방법 및 비율(%)변수 처리방법

1,285 views
Skip to first unread message

Heetaek Lim

unread,
Nov 18, 2018, 5:03:38 AM11/18/18
to 통계상담Q&A그룹 : 한남대학교 권세혁교수

안녕하세요?

다중회귀모형 분석을 진행중에 있으며, 선형성 문제등으로 종속변수 및 독립변수를 모두 로그변환 하려고 합니다.

질의 1) 로그변환하려는 종속변수의 원자료값이 모두 양수며 연속형 데이터 이기는 하지만, 1보다 작은 수치가 있고, 특히 0을 포함하고 있어, 로그변환 시 음수로 변환이 되거나 결측치로 변환이 됩니다. 따라서, 원자료에 1을 더해서 자연로그값을 취한 후에 회귀분석을 하려고 합니다. 
이때, 종속변수만 1을 더해서 로그변환하면 되는 것인지? 아니면 독립변수들 또한 1을 더해서 자연로그로 변환해야 하는 것인지요? 독립변수들은 모두 큰 값이기 때문에, 1을 더해줄 필요가 없는 상황 입니다.

질의 2) 원자료 독립변수의 값중에 비율(%)가 있습니다. 예를들어, 원자료값이 10%인 경우에 자료값을 0.1 또는 10 으로 넣을 수 있을 것 같습니다. 문제는 0.1과 같이 원자료 값을 넣을 시에, 로그변환을 시킬 경우 모든 자료값이 1보다 작은 값이기 때문에, 로그변환 후에 값이 음수로 변환되는 문제가 발생합니다. 
이럴경우, 1을 더해서 자연로그변환을 하면 되는 것인지요? 아니면, %를 떼고 10을 원자료로 넣어서 자연로그변환을 하는 것이 좋은 것인지요?

Message has been deleted
Message has been deleted

통계상담_한남대권세혁교수

unread,
Nov 18, 2018, 7:17:09 AM11/18/18
to 통계상담Q&A그룹 : 한남대학교 권세혁교수
원자료가 0, 음수가 있는 데이터가 우로 치우친 경우 정규변환을 위하여 로그 변환 시  
일정한 양수를 더할 때 다음 규칙을 사용하는 것이 적절합니다.
한자리 숫자(1~9) 값인 경우 0.01, 두자리(10~99) 숫자 0.1, 그 이상안 1을 더하면 됩니다. 
비율은 비율(두자리 숫자)인 경우 %로 사용하고 0.1을 더하면 됩니다. 

Best wishes,
Reply all
Reply to author
Forward
0 new messages