안녕하세요?
다중회귀모형 분석을 진행중에 있으며, 선형성 문제등으로 종속변수 및 독립변수를 모두 로그변환 하려고 합니다.
질의 1) 로그변환하려는 종속변수의 원자료값이 모두 양수며 연속형 데이터 이기는 하지만, 1보다 작은 수치가 있고, 특히 0을 포함하고 있어, 로그변환 시 음수로 변환이 되거나 결측치로 변환이 됩니다. 따라서, 원자료에 1을 더해서 자연로그값을 취한 후에 회귀분석을 하려고 합니다.
이때, 종속변수만 1을 더해서 로그변환하면 되는 것인지? 아니면 독립변수들 또한 1을 더해서 자연로그로 변환해야 하는 것인지요? 독립변수들은 모두 큰 값이기 때문에, 1을 더해줄 필요가 없는 상황 입니다.
질의 2) 원자료 독립변수의 값중에 비율(%)가 있습니다. 예를들어, 원자료값이 10%인 경우에 자료값을 0.1 또는 10 으로 넣을 수 있을 것 같습니다. 문제는 0.1과 같이 원자료 값을 넣을 시에, 로그변환을 시킬 경우 모든 자료값이 1보다 작은 값이기 때문에, 로그변환 후에 값이 음수로 변환되는 문제가 발생합니다.
이럴경우, 1을 더해서 자연로그변환을 하면 되는 것인지요? 아니면, %를 떼고 10을 원자료로 넣어서 자연로그변환을 하는 것이 좋은 것인지요?