繁体 English 中英

为什么霍夫曼的编码算法比原始大小占用更多位？

[英]Why Huffman's coding algorithm takes more bit than the original size?

原文 2021-12-06 13:01:47 1 3 algorithm/ huffman-code

我给定的字符串是“Today_is_Monday”。 如果我将霍夫曼的编码算法应用于这个字符串。 如果没有编码，字符串的总大小为(15*8) = 120位。 编码后大小为(10*8 + 15 + 49) = 144位。

据我所知，霍夫曼的算法用于减小尺寸。 但是为什么编码后的大小比原来的大呢？

我所做的更多细节如下

谢谢你。

3 个解决方案

给定频率表，霍夫曼编码优化了消息长度。 您如何处理频率表取决于您。

非常短消息的应用程序通常假设发送器和接收器都事先知道的 static 频率表，因此不必发送。

需要发送频率表的应用程序通常会执行额外的优化。 可以通过按字母顺序仅传输每个符号的长度来传达树。 然后可以对长度本身进行霍夫曼编码。

文字太短，概率分布 function看起来很均匀。 如果出现频率（或多或少）相同，则输入字符串非常接近随机噪声。 用一般的方式压缩随机噪声是不可能的，压缩很可能比输入序列长，因为还需要添加一些元数据，比如编码表。

相反，考虑编码一个字符串： aaaaaaaaaaaaaaa 。

如果尝试对较长的通用英文文本进行编码，则会在某个时候注意到，编码后的字符串大小将开始显着短于原始文本。 这是因为编码的序列频率将开始产生更大的影响 - 最频繁的字符将使用尽可能短的代码进行编码，并且由于它重复很多，其较短的大小将支配原始字符的大小。

没有可逆压缩算法可以保证压缩所有可能的输入。 如果有，那么您可以反复输入它自己的 output 并最终将任何输入文件减少到 1 位。 对于任何初始输入文件。

因此，必须有一些输入不能被任何特定算法压缩。

正如其他人所解释的那样，您发现了霍夫曼无法压缩的输入。

为什么霍夫曼编码好？

[英]Why Huffman Coding is good?

霍夫曼编码算法/数据结构

[英]Huffman Coding Algorithm/Data Structures

逆霍夫曼算法？

[英]Reverse Huffman's algorithm?

在霍夫曼编码算法中识别字符的位置

[英]Identifying the positions of characters in Huffman Coding Algorithm

无需修改原始Node即可对Dijkstra的算法进行编码

[英]Coding Dijkstra's algorithm without modifying original Node

是否有数学证明霍夫曼编码是最有效的无损压缩算法？

[英]Is there mathematical proof that Huffman coding is the most efficient lossless compression algorithm?

仅使用霍夫曼编码的算法示例是什么？

[英]What is an example of an algorithm which uses Huffman coding only?

霍夫曼编码算法（优先级队列与已排序队列）

[英]Huffman Coding Algorithm(Priority queue vs Sorted queue)

逆霍夫曼编码

[英]Reversed Huffman coding

霍夫曼编码树遍历

[英]Huffman Coding Tree traversal

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 为什么霍夫曼编码好？霍夫曼编码算法/数据结构逆霍夫曼算法？在霍夫曼编码算法中识别字符的位置无需修改原始Node即可对Dijkstra的算法进行编码是否有数学证明霍夫曼编码是最有效的无损压缩算法？仅使用霍夫曼编码的算法示例是什么？霍夫曼编码算法（优先级队列与已排序队列）逆霍夫曼编码霍夫曼编码树遍历

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM