我为压缩大文件测试了象邮编、gzip、arj、bzip2,瓶子等的几个文件压缩节目。 语科库构成了共计298.8 MB的5个POI引起的Microsoft Excel文件。 并且有一个全胜的赢家!

关于数据
文件擅长文件是一家非常大公司(读的Fortune 500)的标准公司数据。 没什么特别关于同样地数据,规则文本数据擅长文件。 明显地我不可能分享数据为独立证明。

没被测试的档案格式
因为他们不容易地是可利用的在Linux,我未测试二个普遍的文件格式- rar & 7zip。

结果

压缩算法 压缩的大小 %压缩
tar.bz2 10.9 MB 96.35
tar.gz 52.5 MB 82.43
邮编 52.5 MB 82.43
arj 52.5 MB 82.43
瓶子 52.5 MB 82.43

测试笔记
装备有在Linux的地精UI的文件路辗档案经理比bzip2 -9提供更好的bzip2压缩!
bzip2 -9压缩了对12 MB。

我也尝试了.tar .zip是最坏的。

所有文件格式需要了可比较的时间另一方面,但是我测试了他们在与2 GB RAM和RAID 1 SATA驱动的核心2二重奏6600 :)
因为这样结果不推测关于表现。

所有压缩文件为数据的准确性被测试了。

优胜者
这显示所有普遍的压缩算法在同一个水平上有bzip2的单一例外,站立在休息之前的同盟。 压缩算法的全胜的赢家是bzip2。

Linux和Windows用户能通过直接跑可执行的bzip使用bzip2 (可下载的从 bzip2.org)。 7Zip和WinZip,两支持bzip2格式的最新的版本。

Linux用户有一个优胜者在 文件路辗