.tar.gz 파일 압축 오류

709 views
Skip to first unread message

SkyKiDS

unread,
Dec 10, 2011, 5:48:49 AM12/10/11
to 반디소프트-반디집
안녕하세요? :) (너무 자주 올리나요...;)

일부 압축파일을 반디집에서 오류가 있다며 압축을 풀지 못합니다.
제가 가지고 있는 파일은 Samsung Open Source Release Center의 오픈 소스 파일입니다.
예를 들면 SHW-M100S의 일부 파일에 오류가 있다고 합니다. 하지만 7-Zip의 경우에는 오류가 없다고 하네요.
다른 압축 프로그램은 시험하지 못했습니다.

일단 gzip만 압축을 풀 때 200% 이상 넘어갑니다. 그런데 희한하게도 7-Zip이 압축을 정상적으로 풀었을 때와 .tar
파일 크기가 같습니다.
그런데 .tar 파일의 압축을 풀었을 때에는 양쪽의 전체 크기가 다르네요. 파일의 개수가 다릅니다.

의심가는 사항은 (아마도) 리눅스 기반 환경에서 압축을 해서 그런지 대소문자로 구분되는 중복 파일이 많습니다.
하지만, 모든 파일을 이름 변경하도록 했고, 7-Zip도 마찬가지로 파일 이름을 변경하도록 하였는데 그렇네요.
아마 확장자가 없는 파일의 이름 변경이나, 무시하도록 했다거나, .. 등으로 생각은 하지만 모르겠네요.
중복 파일도 많아서 하나하나 보기가 힘듭니다.

버그 알림이를 이용하여 파일을 보냈습니다. 관련있는 파일 몇 개도 마찬가지 증상을 보입니다.

반디집

unread,
Dec 12, 2011, 1:22:57 AM12/12/11
to bandiz...@googlegroups.com
네, 문제가 있는 파일을 보내주셔서 감사합니다. ^^


* 일단 .gz 압축을 풀었을때 200% 이상 나오는 이유는 .gz 파일 정보가 잘못되었기 때문입니다.

7zip 으로 해당 파일을 열어보시면 압축전 크기가 148MB 로 표시되지만 실제로 압축을 풀어보면

381MB 짜리 파일이 나오는것을 확인하실 수 있습니다.

아마도 파일 뒷부분이 잘린듯 한데, 이 때문에 파일의 크기 정보가 제대로 저장되지 않은듯 합니다.


* 비슷한 이유로 반디집에서 파일을 열었을때 "이 파일은 손상된 파일입니다." 라는 메시지가 표시됩니다.

.gz 파일은 파일 맨 뒤에 crc 정보가 포함되어 있는데, 보내주신 파일은 crc 정보가 다르게 나오는것을

확인하였고 이때문에 경고메시지가 출력됩니다.

* tar 를 풀었을때 파일 비교는, 일단 7zip 으로 풀어보면서 모두 덮어쓰도록 설정을 하고

마찬가지로 반디집도 전부 덮어쓰도록 설정후 압축을 풀고 나서 두 폴더의 내용을 비교하였는데

별다른 차이가 없음을 확인하였습니다. 아마도 7zip 과 중복파일의 처리를 다르게 설정하여서 다른

결과를 얻으신것이 아닌가 추측됩니다.

2011년 12월 10일 오후 7:48, SkyKiDS <skyk...@gmail.com>님의 말:

SkyKiDS

unread,
Dec 13, 2011, 6:25:39 AM12/13/11
to 반디소프트-반디집
아, 그러면 오히려 7-Zip이 잘못된 것이군요. 저도 방금 확인했네요.
제 생각이 좀 짧았네요. 7-Zip이 항상 옳은 것은 아니었군요. (이런 오류를 범하다니...)
반디집도 마찬가지로 148MB로 나타나네요. (한꺼번에 풀기가 아닌 경우)

하지만, 이 때에 오류가 있다고 보여주지는 않습니다. (이것은 문제로 보입니다. 한꺼번에 풀기에는 나타나지만 아닌 경우에는 나타
나지 않네요.)

148MB의 두 배가 넘어가니 200%가 넘어가는 것은 맞겠군요.

일단 제대로 압축을 풀어주는 것은 맞군요. 단, 중복 파일의 처리가 어느 것이 옳은지는 확인해 보는 것이 좋겠습니다.
리눅스에서 압축을 풀어보고 파일 및 디렉토리의 개수를 파악해 보아야 하겠군요. (거기까지는 귀차니즘이... ㅎ)

On 12월12일, 오후3시22분, 반디집 <bandi...@bandisoft.com> wrote:
> 네, 문제가 있는 파일을 보내주셔서 감사합니다. ^^
>
> * 일단 .gz 압축을 풀었을때 200% 이상 나오는 이유는 .gz 파일 정보가 잘못되었기 때문입니다.
>
> 7zip 으로 해당 파일을 열어보시면 압축전 크기가 148MB 로 표시되지만 실제로 압축을 풀어보면
>
> 381MB 짜리 파일이 나오는것을 확인하실 수 있습니다.
>
> 아마도 파일 뒷부분이 잘린듯 한데, 이 때문에 파일의 크기 정보가 제대로 저장되지 않은듯 합니다.
>
> * 비슷한 이유로 반디집에서 파일을 열었을때 "이 파일은 손상된 파일입니다." 라는 메시지가 표시됩니다.
>
> .gz 파일은 파일 맨 뒤에 crc 정보가 포함되어 있는데, 보내주신 파일은 crc 정보가 다르게 나오는것을
>
> 확인하였고 이때문에 경고메시지가 출력됩니다.
>
> * tar 를 풀었을때 파일 비교는, 일단 7zip 으로 풀어보면서 모두 덮어쓰도록 설정을 하고
>
> 마찬가지로 반디집도 전부 덮어쓰도록 설정후 압축을 풀고 나서 두 폴더의 내용을 비교하였는데
>
> 별다른 차이가 없음을 확인하였습니다. 아마도 7zip 과 중복파일의 처리를 다르게 설정하여서 다른
>
> 결과를 얻으신것이 아닌가 추측됩니다.
>

> 2011년 12월 10일 오후 7:48, SkyKiDS <skykid...@gmail.com>님의 말:

Reply all
Reply to author
Forward
0 new messages