繁体 English 中英

C ++哈希：开放式寻址和链接

[英]C++ hashing: Open addressing and Chaining

原文 2012-06-01 00:08:57 7 3 c++/ hash/ chaining/ addressing

对于链接：

有人可以向我解释这个概念，并提供一个理论示例和一个简单的代码吗？

我想到了“每个表的位置都指向散列到该位置的项目的链表（链）”，但是我似乎无法说明实际情况。

假设我们有h（x）（哈希函数）= x / 10 mod5。现在哈希12540、51288、90100、41233、54991、45329、14236，它看起来像什么？

对于开放式寻址（线性探测，二次探测以及对每个R位置的探测），有人还能向我解释吗？ 我尝试了Googling，但似乎进一步感到困惑。

3 个解决方案

链接可能是最明显的哈希形式。 哈希表实际上是最初为空的链表的数组。 通过在项目的计算表索引处的链接列表中添加新节点，可以插入项目。 如果发生冲突，则将新节点链接到链表的上一个尾节点。 （实际上，一个实现可以对列表中的项目进行排序，但让我们保持简单）。 这种模式的一个优点是哈希表永远不会变“满”，缺点是您在内存中跳了很多，而CPU缓存会讨厌您。

Open Addressing尝试利用以下事实：哈希表可能会被稀疏地填充（条目之间的间隙很大）。 哈希表是一个项目数组。 如果发生冲突，则算法会在哈希表中搜索下一个空白空间，而不是将该项目添加到该位置当前项目的末尾。 但是，这意味着您不能仅依靠哈希码来查看是否存在项，如果哈希码匹配，还必须比较内容。 “探测”是算法在尝试找到下一个空闲插槽时遵循的策略。 一个问题是表可能已满，即不再有空槽。 在这种情况下，将需要调整表的大小，并更改哈希函数以考虑新的大小。 表中的所有现有项目也必须重新插入，因为一旦更改了哈希函数，它们的哈希码将不再具有相同的值。 可能还要等一下。