안녕하세요.
저희는 로그를 S3로 적재하고 이를 타조를 통하여 조회하고 있습니다.
데이터는 gz으로 압축되어 있고, json 포멧으로 되어 있습니다.
예를들면, 아래와 같은 형식입니다.
{
"AddInfo": {
"LifecycleId": "TEST"
},
"MarketId": 1,
"UserId": xxx,
"LogTime": "2016-05-22 23:59:21",
"LogType": "LoginUser",
"Game": "TEST"
}
이를 조회하기 위해 저희는
아래와 같이 테이블을 생성하고 조회를 합니다.
CREATE EXTERNAL TABLE IF NOT EXISTS AA (
"LogTime" timestamp,
"LogType" text,
"UserId" text,
"Game" text,
"MarketId" text,
"AddInfo" RECORD(
"LifecycleId" text
)
)USING json PARTITION BY COLUMN (regdate int) LOCATION 's3://xxxx~';
여기서 저희는 두가지 불편함이 있는데,
첫번째는 Record타입이 들어가는경우 *을 사용할 수 없게 되는점 입니다.
두번째는 컬럼을 명시할때 대소문자를 구분해야 해서,
select "LogTime", "LogType" ~~~ from AA ~;
이와같이 쌍따옴표를 넣어야 하는 문제가 있습니다.
문제라기 보단 불편함이 맞겠습니다.
혹시 이 불편함을 조금이나마 해소하기위한 팁이 있을까요?