繁体   English   中英

简单/高效的文本压缩

[英]Simple/efficient text compression

什么是最简单但有效的压缩算法?

Deflate,lzma等不是有效选项。 我需要一些编译非常小的东西,比如:RLE,LZX,Huffman等。

注意:数据是95%的ASCII文本
编辑:目前数据约为20kb,但我预计它会增长到1mb

EDIT2:
其他有趣的选择
smaz https://github.com/antirez/smaz
FastLZ http://fastlz.org/

听起来LZO的设计符合您的要求:

  • 减压简单而且非常快。
  • 解压缩不需要内存。
  • 压缩非常快。

这个基准有很多比较。 检查它,因为它还显示了压缩过程中使用的算法。

基于BWT的东西可能对这种情况有好处。 http://en.wikipedia.org/wiki/Burrows%E2%80%93Wheeler_transform
它比LZ更好地压缩文本,并且易于从头开始实现,并且有很好的库。
http://libbsc.com
http://encode.ru/threads/104-libBWT?p=22903&viewfull=1#post22903
http://code.google.com/p/libdivsufsort/

或者,或者,在rar / winzip / 7-zip等中使用ppmd用于文本压缩,但它更复杂。
http://www.compression.ru/ds/ppmdj1.rar
http://www.compression.ru/ds/ppmsj.rar (更快/小内存使用)
http://www.ctxmodel.net/files/PPMd/ppmd_Jr1_sh8.rar (备用端口)

大多数字典方案都会做得很好。 任何LZ。 我们在嵌入式系统上使用LZ77 varient来处理我们的许多简单压缩内容,并且它几乎没有内存开销,效果很好。 什么样的系统正在压缩和什么是解压缩? 这将决定你可以逃脱的压缩机类型。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM