文本压缩最容易理解和实现的是 BWT(Block Sorting) 算法,压缩率也不错,远远超过 zip 的 deflate。
实现可以参考 bzip2,不过它为了避免专利问题,用了个 huffman 做后端,没能达到最佳压缩率。
jiang li wrote:
> ���Ӵ�����һ��PPM�㷨��prediction by partial
> matching��������Щ�ĵ��������Ƕ�д�ò�����������˶�������㷨���ܲ��ܾٸ�����ӽ���һ���㷨����أ�
>
> ���ҵ���һƪ"���ѹ�����ʷ"��������˼����
>
> ����������ѹ����ʵ��������ü�ǵ������˶���������}���á���һ�����Խ�ʡ�ռ䡣��������ü4˵��Ҫ�ǰ˸���ü���Լ���һ~�����Ǹ��ж�ʡǮ�����ڶ������Լ��ٶԴ���ռ�á����磬���Ƕ����ڲ���
> 100Kbps �� GPRS ���Ϲۿ� DVD
> ��Ƭ����ͺñ�������ü����ϣ����һ�߲��ó�������#�ǰ���д������ѹ�����ͻ���Խ�չ��������ȡ������ü�ǵĺ��ĺ���f��
>
> ��˵�����û�����ѹ�������Ǿ�û���� WinRAR Ϊ Email �еĸ������?���û�����ѹ�����г��ϵ�����¼��ʾ�ֻ�ܼ�¼���� 20
> ���ӵ��������û�����ѹ����� Internet
> ������һ����ӰҲ��Ҫ�������ʱ�䡭��������һ�о��������ʵ�ֵ��أ����ѹ����������������з�չ��4���أ�
>
> ������Ե
> һǧ����ǰ���й�ѧ�߾�֪����"����"�����������4ָ���̺�˾��Ǩ�����ֳ��м�Լ�ķ���һֱ�����˽���� Internet ʱ�������� BBS
> ����" 7456 "���"��������"��������" B4 "���" Before "��ʱ����������Ӧ��֪�#�����ʵ����һ��������ѹ��ѽ��
>
> �ϸ������ϵ����ѹ����Դ�����ǶԸ��ʵ���ʶ�������Ƕ�������Ϣ���б���ʱ�����Ϊ���ָ��ʽϸߵ���ĸ����϶̵ı��룬Ϊ���ָ��ʽϵ͵���ĸ����ϳ��ı��룬�ܵı��볤�Ⱦ�����̲��١�Զ�ڼ�������֮ǰ�������
> Morse ������Ѿ��ɹ���ʵ������һ���� Morse ����У�ÿ����ĸ����Ӧ��һ��Ψһ�ĵ㻮��ϣ����ָ�����ߵ���ĸ e ������Ϊһ���" .
> "������ָ��ʽϵ͵���ĸ z ����Ϊ" --.. "����Ȼ���������Ч������յĵ��볤�ȡ�
>
> ��Ϣ��֮�� C. E. Shannon ��һ������ѧ���Բ����˸�������Ϣ����ȵĹ�ϵ���� 1948 �귢�������"ͨ�ŵ���ѧ���ۣ� A
> Mathematical Theory of Communication ��"�� Shannon
> ָ���κ���Ϣ���������࣬�����С����Ϣ��ÿ���ţ����֡���ĸ�ʣ��ij��ָ��ʻ���˵��ȷ�����йء� Shannon
> �������fѧ�ĸ������Ϣ���ų���������ƽ����Ϣ ��Ϊ"��Ϣ��"��������˼�����Ϣ�ص���ѧ���ʽ����ƪΰ������ĺ�4����Ϊ��Ϣ�۵Ŀ�ɽ֮����Ϣ��Ҳ�춨���������ѹ���㷨�����ۻ��ӱ����Ͻ������ѹ���Ŀ�ľ���Ҫ�����Ϣ�е����࣬����Ϣ�ؼ���صĶ���ǡǡ����ѧ�ֶξ�ȷ����������Ϣ����ij̶ȡ�������Ϣ�ع�ʽ�����ǿ��Լ������Ϣ����ļ��ޣ�����һ���ĸ���ģ���£�����ѹ��ı��볤�Ȳ�����С����Ϣ�ع�ʽ���Ľ��
>
> �����걸�����ۣ�����4���¾���Ҫ��취ʵ�־�����㷨������ ʹ�㷨�����ӽ���Ϣ�صļ����ˡ���Ȼ�������̼�����Ա��֪�#�Ҫ��һ�����۴���ѧ��ʽ��չ��ʵ�ü�������ƾһ��
> E=mc 2 �Ĺ�ʽ��Ҫȥ���������һ������һ���������¡�
>
> ��ѧ��Ϸ
> ��ƾ����ѹ���㷨�Ĺ��ͨ��������һ����ѧ��Ϸ������������ҪѰ��һ���ܾ� ��ȷ��ͳ�ƻ�<���Ϣ�з�ų��ָ��ʵķ�����Ȼ��Ҫ���һ������̵Ĵ�������ÿ���ŵı������ͳ��ѧ֪ʶ����ǰһ����൱��Ч�����Ϊֹ�������Ѿ�½��ʵ���˾�̬ģ�͡��뾲̬ģ�͡�����Ӧģ�͡�
> Markov ģ�͡�����ƥ��Ԥ��ģ�͵ȸ���ͳ��ģ�͡���Զ��ԣ����뷽���ķ�չ��̸�Ϊ����һЩ��
>
> 1948 �꣬ Shannon �������Ϣ�����۵�ͬʱ��Ҳ�����һ�ּı��뷽������ Shannon ���롣 1952 �꣬ R. M. Fano
> �ֽ�һ������� Fano ���롣��Щ���ڵı��뷽����ʾ�˱䳤����Ļ���ɣ�Ҳȷʵ����ȡ��һ����ѹ��Ч��������ʵ�õ�ѹ���㷨����ȥ��Զ��
>
> ��һ��ʵ�õı��뷽������ D. A. Huffman �� 1952 �������"��С����ȴ���Ĺ��췽���� A Method for the
> Construction of Minimum Redundancy Codes
> ��"�����ġ�ֱ�����죬��ࡶ��ݽṹ���̲������۶�����ʱ��Ҫ�ἰ���ֱ����˳�Ϊ Huffman ����ķ����� Huffman
> �����ڼ��������������������l����ķ����̱���Ҳ�������ǽ���ֵ5Ļ��⡣��˵�� 1952 ��ʱ������� Huffman
> ������ʡ�?ѧԺ��һ��ѧ����Ϊ������ʦ֤���Լ����Բ��μ�ij�Ź��ε���ĩ���ԣ������������Ƽ���ȴӰ����Զ�ı��뷽����
>
> Huffman ����Ч�ʸߣ������ٶȿ죬ʵ�ַ�ʽ���� 20 �<� 60 ����}������ѹ������õ��˹㷺��Ӧ�á����磬���� UNIX
> ϵͳ��һ��̫Ϊ�ִ�����֪��ѹ����� COMPACT ʵ�ʾ��� Huffman 0 ������Ӧ����ľ���ʵ�֡� 20 �<� 80 ���� Huffman
> �����ֳ����� CP/M �� DOS ϵͳ�У��������� SQ �����죬�����֪���ѹ��ߺ�ѹ���㷨���� WinRAR �� gzip �� JPEG
> ������� Huffman �������Ӱ������ Huffman
> ������õı��볤��ֻ�Ƕ���Ϣ�ؼ������һ�ֽ��ƣ���������ƽ���Ϣ�صļ��ޡ�����Ϊ��ˣ��ִ�ѹ����ͨ��ֻ�� Huffman
> �������յı����ֶΣ�������ѹ���㷨��ȫ����
>
> ��ѧ����һֱû�з�������Ϣ�ؼ�����ս�����롣 1968 ��ǰ�� P. Elias ��չ�� Shannon �� Fano
> �ı��뷽������������ѧ�Ƕȿ�4��Ϊ���5� Shannon-Fano-Elias ���롣������һ���뷽����˼·�� 1976 �꣬ J. Rissanen
> �����һ�ֿ��Գɹ��رƽ���Ϣ�ؼ��ı��뷽������������롣 1982 �꣬ Rissanen �� G. G. Langdon
> һ��Ľ���������롣֮�������ֽ���������� J. G. Cleary �� I. H. Witten �� 1984 �����IJ���ƥ��Ԥ��ģ�ͣ� PPM
> �����ϣ���������ѹ��Ч�������5��㷨�����죬��Щ��Ϊ PPMC �� PPMD �� PPMZ
> ���ų�ѹ��Ч�����µ�һ��ͨ��ѹ���㷨��ʵ����ȫ������һ˼·�ľ���ʵ�֡�
>
> ��������ѹ����ԣ� PPM
> ģ��������������ϣ��Ѿ��������̶ȵرƽ���Ϣ�صļ��ޡ�����4��ѹ����ķ�չ���Ե���Ϊֹ�ˡ����ҵ��ǣ����������������е���������������Ȼ���Ի����̵ı��볤�ȣ����䱾��ĸ�����Ҳʹ�����������κξ���ʵ��������ʱ��������ţ����ʹ��Ħ���ɴ�����#�
> CPU �ٶ���������Ľ��죬����������������ٶ�Ҳ���������ճ�Ӧ�õ�����û�취������Ǻ��Ľ�Ҫ�ᵽ����}����̫�ˣ����ǻ���֪Ҫ��ʲôʱ���������
> WinZIP �����ʵ�õ�ѹ����ء�
>
> ���崫˵
> ����˼ά��Զ�ǿ�ѧ�ͼ��������������ʤ�ķ��������ڴ�����˽ʾ���֭��Ľ� Huffman
> ��������룬�Ի��һ�ּ���������ٶȺ�ѹ��Ч���"����"�����ʱ��}��������̫�� J. Ziv �� A. Lempel �1��辶����ȫ����
> Huffman �������������˼·���������һϵ�б� Huffman
> �������Ч�������������ݵ�ѹ���㷨������ͨ������}����̫�����ϵ���д������Щ�㷨ͳ��Ϊ LZ ϵ���㷨��
>
> ����ʱ��˳�� LZ ϵ���㷨�ķ�չ��̴����ǣ� Ziv �� Lempel �� 1977 �귢����Ϊ"˳�����ѹ���һ��ͨ���㷨�� A
> Universal Algorithm for Sequential Data Compression ��"�����ģ�������������㷨�����˳�Ϊ LZ77
> �㷨�� 1978 �꣬�����ַ����˸����ĵ���ƪ"ͨ��ɱ���ʱ���Ķ�b���е�ѹ�� Compression of Individual
> Sequences via Variable Rate Coding ��"�������˺�4������Ϊ LZ78 ��ѹ���㷨�� 1984 �꣬ T. A.
> Welch ��������Ϊ"���������ѹ���� A Technique for High Performance Data Compression
> ��"�����ģ����������� Sperry �о����ģ����о����ĺ�4������ Unisys ��˾�����о��ɹ����� LZ78
> �㷨��һ����֣�Ҳ���Ǻ�4�dz������ LZW �㷨�� 1990 ��� T. C. Bell ������½���������� LZ ϵ���㷨�ı����Ľ�汾��
>
> ˵ʵ���� LZ
> ϵ���㷨��˼·�������ʣ����м�û�и�������۱�����Ҳû�и��ӵ���ѧ��ʽ������ֻ�Ǽ�������ǧ����4���Ƕ��ֵ�����ϲ�ã�����һ�ּ�Ϊ����ķ�ʽ���ֵ似��Ӧ����ͨ�����ѹ������ͨ��˵���������ֵ��е�ҳ����кŴ���������ÿ��ʵ�ʱ����ʵ�����Ѿ�������
> LZ ϵ���㷨�����С����ֻ����ֵ�ģ�͵�˼·�ڱ�������Ȼ�� Shannon �� Huffman
> ���˿�����ͳ��ѧ�������ྶͥ������Ч����һ����Աƽ���Ϣ�صļ��ޡ����ң����Դ�������֤�� LZ ϵ���㷨�ڱ�������Ȼ�����Ϣ�صĻ���ɡ�
>
> LZ ϵ���㷨����Խ�Ժܿ�������ѹ������������ �� ��4��ʹ�� LZ ϵ���㷨�Ĺ�������� �ʱ�ըʽ��� UNIX ϵͳ�����ȳ�����ʹ�� LZW
> �㷨�� compress ���ó���ܿ��Ϊ�� UNIX �=��ѹ��������������� MS-DOS �����µ� ARC �����Լ� PKWare ��
> PKARC �ȷ���Ʒ�� 20 �<� 80 ��������ѹ��� LHarc �� ARJ ���� LZ77 �㷨�Ľܳ��?
>
> ���죬 LZ77 �� LZ78 �� LZW �㷨�Լ����ǵĸ��ֱ��弸��¢�������ͨ�����ѹ������������Ϥ�� PKZIP �� WinZIP ��
> WinRAR �� gzip ��ѹ����Լ� ZIP �� GIF �� PNG ���ļ���ʽ���� LZ ϵ���㷨�������ߣ�����l PGP
> ����ļ����ļ���ʽҲѡ���� LZ ϵ���㷨��Ϊ�����ѹ��ı���
>
> û��˭�ܷ���}λ��̫�˶����ѹ����Ĺ��ס�����ǿ���ֻ�ǣ��ڹ��̼�������Ƭ���������ϵ���������ֻ���±����룬��������� Ziv �� Lempel
> ����������Ƕ�4˼�����⣬û�����Ҿ��ܷ���һ���µ��㷨�������ڼ���չʷ������b���ء�
>
> ��ʱ��
> LZ ϵ���㷨������ͨ�����ѹ���м���ٶ���ѹ��Ч������⡣���ǣ����ѹ�������ﻹ����һƬ��Ϊ��+����صȴ�������ȥ̽�� Shannon
> ����Ϣ�۸������ǣ�����Ϣ������֪ʶԽ�࣬���ǾͿ�����Ϣѹ���ԽС�����仰˵�����ѹ���㷨�����Ŀ�겻����������Դ�����ǻ�������֪��������ݣ�ѹ���Ч��ͻ��һ����ߡ����������ǣ��ڷ�չͨ��ѹ���㷨֮�࣬�����������о���Ը���������ݵ�ר��ѹ���㷨���ȷ�˵���ڽ������������У��鲼�������������¼��ʡ��������������������ȸ��������豸�е�ͼ����Ƶ����Ƶ��Ϣ���ͱ��뾭����Ч��ѹ�������Ӳ���ϴ洢����ͨ��
> USB
> ���´��䡣ʵ���ϣ���ý����Ϣ��ѹ��һֱ�����ѹ�����������Ҫ���⣬���е�ÿһ���֧���п�����δ4��ij�������Ϊ�����Ʒ��ͨ���豸��Ӧ����������̴�4�����̻�
>
> �������ȴ�ͼ����ݵ�ѹ����ͨ����˵��ͼ����Ա���Ϊ��ֵͼ�Ҷ�ͼ��ɫͼ��Ȳ�ͬ�����͡�ÿһ��ͼ���ѹ���Ҳ������ͬ��
>
> ���漼��ķ���㷺ʹ�ôٽ��˶�ֵͼ��ѹ���㷨�ķ��ٷ�չ�� CCITT ����ʵ籨�绰��ѯίԱ�ᣬ�ǹ�ʵ���j�� ITU
> �����һ�����Դ�����Ӧ�ý�b��һϵ��ͼ��ѹ�����ר����ѹ��ʹ��ݶ�ֵͼ����Щ�����°�( 20 �<� 70 �����ڵ� CCITT Group
> 1 �� Group 2 �� 1980 ��� CCITT Group 3 ���Լ� 1984 ��� CCITT Group 4
> ��Ϊ����Ӧ��ͬ���͵Ĵ���ͼ����Щ�����õı��뷽����(��һά�� MH ����Ͷ�ά�� MR ���룬����ʹ�����г̱��루 RLE ���� Huffman
> ����ȼ�����죬�����ڰ칫�һ�����շ�����ʱ��ʹ�õĴ���� CCITT Group 3 ѹ�����һЩ������������Ĵ����豸�ʹ�Ŷ�ֵͼ��� TIFF
> �ļ���ʹ���� CCITT Group 4 ѹ����� 1993 �꣬ CCITT �� ISO ����ʱ�����֯����ͬ��b�Ķ�ֵͼ��j��ר���飨
> Joint Bi-level Image Experts Group �� JBIG ���ֽ���ֵͼ���ѹ���һ����չΪ���ͨ�õ� JBIG ����
>
> ʵ���ϣ����ڶ�ֵͼ��ͷ�l��ĻҶȡ���ɫͼ����ԣ���( LZ ϵ���㷨���ڵ����ͨ��ѹ���㷨���ܻ�úܺõ�ѹ��Ч�����磬������ 1987 ��� GIF
> ͼ���ļ���ʽʹ�õ��� LZW ѹ���㷨�� 1995 ����ֵ� PNG ��ʽ�� GIF ��ʽ������ƣ���ѡ���� LZ77 �㷨�ı��� zlib
> 4ѹ��ͼ����ݡ����⣬����ǰ���ᵽ��� Huffman ���롢��������Լ� PPM ģ�ͣ�������ʵ���Ѿ�������������֮��Ч��ͼ��ѹ���㷨��
>
> ���ǣ���������и�ӳ���ģ�����ֵ�ڿռ���l��仯�ĻҶȻ��ɫͼ����������Ƭ����ͨ��ѹ���㷨�����ƾͲ���ô�����ˡ����˵��ǣ���ѧ���Ƿ��֣������ѹ����һ��ͼ�����ʱ����ı�һЩ��̫��Ҫ������ֵ������˵������ʧһЩ���ȣ���ѹ��ͨ�����ʱ�����Ǿ�������κξ����ϵ���ʧ������ѹ�����ʾһ��������Ƭʱ�����һƬ������ijЩ��Ҷ����ɫ��������һЩ������Ƭ����ͨ���Dz����ģ������Ǿ��п�����ѹ��Ч���ϻ��ͻ���ԵĽ�չ����һ˼�������ѹ��������и����Եĵ�λ��ͨ�����û������ͷ�Χ����ʧһЩ���ȣ����ǿ���ͼ��Ҳ��(��Ƶ����Ƶ��ѹ��ԭ��С��ʮ��֮һ���ٷ�֮һ����ǧ��֮һ����ԶԶ������ͨ��ѹ���㷨����f���ޡ�Ҳ�?�������г�˵��"��һ����+���"�ĵ���������ͬ��֮��ɡ�
>
> �������?����ʧ��ѹ��Ҳ����Ϊ����ѹ����ͼ��ѹ����������� JPEG ��������ѹ���㷨�еľ��䡣 JPEG ���ɾ�̬ͼ��j��ר���飨 Joint
> Photographic Experts Group �� JPEG ���� 1986 �꿪ʼ�ƶ��� 1994 ����Ϊ��ʱ��� JPEG
> ����ɢ���ұ任�� DCT ��Ϊ�����㷨��ͨ������� ϵ�����ͼ��ľ��Ⱥʹ�С��������Ƭ��l��仯�ĻҶȻ��ɫͼ�� JPEG
> �ڱ�֤ͼ���� ��ǰ���£�һ����Խ�ͼ��ѹ��ԭ��С��ʮ��֮һ����ʮ��֮һ�������ͼ���� �� JPEG ��� ��Խ�ͼ��ѹ��"����С"��
>
> JPEG �������½�չ�� 1996 �꿪ʼ�ƶ��� 2001 ����ʽ��Ϊ��ʱ��� JPEG 2000 ���� JPEG ��ȣ� JPEG 2000
> ���˴��Ľ���������Ҫ��������ɢС���任�� DWT ������� JPEG ���е���ɢ���ұ任�����ļ���С��ͬ������£� JPEG 2000
> ѹ���ͼ��� JPEG �� ��ߣ�������ʧ��С����Ϊһ���±��� JPEG 2000
> ��ʱ��û�еõ��㷺��Ӧ�ã������(����������������ڵ������ҵ������Ӧ��ǰ����ʾ�ֹۣ� JPEG 2000
> ��ͼ��ѹ��������������ֵ���һ��Ӧ�ò����ر�ңԶ��
>
> JPEG ����ͨ����ʧ����4��ȡѹ��Ч������˼��ֱ��Ӱ������Ƶ��ݵ�ѹ���� CCITT �� 1988 ���ƶ��˵��ӵ绰�ͻ�����ӵ� H.261
> ����ݰ��� H.261 �Ļ�˼·��ʹ������ JPEG
> �����㷨ѹ����Ƶ���е�ÿһ֡ͼ��ͬʱ�����˶�������֡��Ԥ��4�����Ƶ����ʱ��ά���ϵ�������Ϣ���ڴ˻��ϣ� 1993 �꣬ ISO
> ͨ���˶�̬ͼ��ר���飨 Moving Picture Experts Group �� MPEG ������ MPEG-1 ���� MPEG-1
> ���Զ���ͨ�� ����Ƶ��ݽ�����Ч���롣�������ڿ����Ĵ���� VCD Ӱ�����ʹ�� MPEG-1 ��4ѹ����Ƶ��ݵġ�
>
> Ϊ��֧�ָ��������Ƶͼ���ر���֧�����ֵ��ӵȸ߶�Ӧ�ã� ISO �� 1994 ��������µ� MPEG-2 �����൱�� CCITT �� H.262
> ������ MPEG-2 ��ͼ���� ���˷ּ����?������Ӧ��ͨ���ӽ�Ŀ��������ӡ����������ֵ��ӵȲ�ͬ�� ����ƵӦ�á������ǵ�����У������ṩ���������
> DVD Ӱ������õ����� MPEG-2 ����
>
> Internet �ķ�չ����Ƶѹ������˸�ߵ�Ҫ�������ݽ���������༭������ȡ��������Ĵ̼��£� ISO �� 1999 ��ͨ���� MPEG-4
> �����൱�� CCITT �� H.263 �� H.263+ ������ MPEG-4
> ��ӵ�и�ߵ�ѹ����ʣ�֧�ֲ��������ı��롢�������ݵĽ���������ǿ��ʱ��������ȡ���ݴ?�������ݵij߶ȿɱ��Ե��Ƚ����ԡ� Internet
> �����˵� DivX �� XviD �ļ���ʽ���Dz��� MPEG-4 ��4ѹ����Ƶ��ݵģ����ǿ����ø�С�Ĵ洢�ռ��ͨ�Ŵ���ṩ�� DVD
> �������µĸ�������Ƶ����ʹ������ Internet �Ϸ������������ֵ�Ӱ�������Ϊ����ʵ��
>
> ������Ƶѹ��͵��Ӳ�ҵ�ķ�չ�ܲ��ɷ�һ����Ƶ��ݵ�ѹ��������Ҳ�������ߵ�㲥������ͨ�ŵ�������ļ�����Ա��չ��4�ġ�������������������ѹ������о���Ϊ��Ծ���Դ�
> 1939 �� H. Dudley ������������4������½��������������ƣ� PCM ��������Ԥ�⣨ LPC ����ʸ ���� VQ
> ��������Ӧ�任���루 ATC �����Ӵ���루 SBC
> ������������봦�?����Щ�������ڲɼ����������ȡ�����źŵ�ͬʱ��ͨ��Ҳ����������Ϣ����ȵ����á���ͼ��ѹ��������� JPEG
> һ��Ϊ��ø�ߵı���Ч�ʣ������������뼼������һ���̶ȵľ�����ʧ�����ң�Ϊ�˸�õ��ö�������ݴ洢���������źţ���Щ������뼼���ڽ������ź�ת��Ϊ������Ϣ֮�����ܻ���
> Huffman ���롢��������ͨ��ѹ���㷨��һ������������е�������Ϣ��
>
> ���ڵ��Ժ����ֵ���������¼��ʡ������������д洢����ͨ��Ƶ��Ϣ�������ʹ�õ�ѹ�����Ҫ�� MPEG ϵ���е���Ƶѹ��������磬 MPEG-1
> ���ṩ�� Layer I �� Layer II �� Layer III �����ֿ�ѡ����Ƶѹ����� MPEG-2 �ֽ�һ�������� AAC ��
> Advanced Audio Coding ����Ƶѹ����� MPEG-4
> ���е���Ƶ������ͬʱ֧�ֺϳ�����������Ȼ�������Ȳ�ͬ���͵�Ӧ�á����������Ƶѹ����У�������Ϊ�ԺյĿ���Ҫ�� MPEG-1 Layer III
> ��Ҳ�������dz�˵�� MP3 ��Ƶѹ����ˡ��� MP3 ������ MP3 �ֻ��Ӳ���϶ѻ���ɽ�� MP3 �ļ��� Internet �ϰ�Ȩ�7ײ��ϵ�
> MP3 ���أ� MP3 ���ѳ��������ѹ����ķ��룬�����һ��ʱ���Ļ��������ˡ�
>
> ����Ȼ���ڶ�ý����Ϣ�����Ϊ������Ϣ��̬�����ֻ�ʱ������ѹ�����ر���ר����ͼ����Ƶ����Ƶ�����ѹ�������൱��ķ�չ�ռ䡪���Ͼ������Ƕ���Ϣ�� ����Ϣ�� ����������ֹ���ġ�
>
> �ص�δ4
> ����Ϣ�ص�������룬����̫�˵� WinRAR ���� JPEG �� MP3
> �����ѹ����ķ�չʷ������һ��д����"����"��"��ս"��"ͻ��"��"���"����Ƥ���ᡣҲ�?���������ﲻ���䷳�������������������ף���Ŀ��ֻ��Ҫ���ߴ�ң�ǰ�˵ijɹ�ֻ�����Ǻ�������Խ��Ŀ����ѣ�˭֪����δ4�ļ����������ּ���
> Shannon ������ Huffman �أ�
>
> ̸��δ4�����ǻ����Բ���һЩ�����ѹ����ķ�չ�����йصĻ��⡣
>
> 1994�꣬ M. Burrows �� D. J. Wheeler
> ��ͬ�����һ��ȫ�µ�ͨ�����ѹ���㷨�������㷨�ĺ���˼���Ƕ��ַ���ת��õ����ַ�����������ͱ任�����Ƶı任�㷨����Ϊ
> Burrows-Wheeler �任����� BWT ���� Ziv �� Lempel ����辶�������һ�ޣ� Burrows �� Wheeler ��Ƶ�
> BWT �㷨����������ͨ��ѹ���㷨�����˼·����Ȼ��ͬ����� BWT �㷨�ڿ���Դ���ѹ��� bzip �л���˾�ijɹ��� bzip
> �����ı��ļ���ѹ��Ч��ҪԶ����ʹ�� LZ
> ϵ���㷨�Ĺ�������������ٿ��Ա����������������ͨ�����ѹ������ֻҪ����˼·�ͼ����ϲ��ϴ��£�������Ȼ�����ҵ��µ�ͻ�ƿڡ�
>
> ����ѹ������ͼ��ѹ���������4��һ���ȵ㡣��һ������Դ�� B. Mandelbrot �� 1977 �괴���ķ��μ���ѧ�� M. Barnsley ��
> 20 �<� 80 ������Ϊ����ѹ��춨�����ۻ��� 20 �<� 90 ���ʼ�� A. Jacquin
> ����½����������ʵ���Եķ���ѹ���㷨�����죬�ܶ������ţ�����ѹ����ͼ��ѹ������������DZf��һ�ּ�����ϵ����Ҳ�кܶ��˶Դ˲�мһ�ˡ�������ǰ����Σ�����ѹ������о��뷢չ����ʾ���ǣ��ھ����˼�ʮ��ĸ��ٷ�չ֮��Ҳ�?������Ҫһ���µ����ۣ����Ǽ��ָ���Ч����ѧģ�ͣ���֧�ź��ƶ����ѹ���������ǰԾ��
>
> �˹���������һ����ܶ����ѹ���δ4�����ش�Ӱ��Ĺؼ�ʡ���Ȼ Shannon
> ��Ϊ����Ϣ�ܷ�ѹ���Լ����ڶ��̶��ϱ�ѹ������Ϣ�IJ�ȷ������ֱ�ӹ�ϵ�������˹����ܼ�����ijһ�������4�����������������һ������֪���� �����IJ²�������Ϣ����ô������Ϣѹ��ԭ��С�����֮һ����ʮ���֮һ�����¾Ͳ������췽ҹ̷�ˡ�
>
> �ع���ʷ֮��������ϲ������һ��δ4����δ4�վ���δ4������ƾ���Ҽ��仰�Ϳ�������δ4�ļ���չ���ƣ��Ǽ����µĹ�������Ȼ��ζ��������˵��δ4������Ҫ����Ҫ���ǣ��Ͽ쵽
> Internet �����ؼ�����Ƭ��Ȼ������ɳ����ú�����һ�����ѹ��Ϊ���Ǵ�4�������ְɡ�