簡體 English 中英

內存地址作為哈希表中的哈希。 HasTable為什么不能將Key的實際內存地址用作Hash？

[英]Memory Address as Hash in HashTable. Why can't HasTable use actual memory address of the Key as Hash?

原文 2012-11-06 18:59:58 8 6 java/ hash/ hashtable/ bucket

可能這是一個基本問題或背后的基本思想。

HasTable為什么不能將Key的實際內存地址用作Hash？ 或哈希密鑰的地址並使用它？

我看到一些帖子說鍵（對象）的默認hashCode()實際上是對象的內存地址，我認為這是不正確的。

我在帖子中讀到，存儲區地址實際上hash % number of existing buckets ？ 這也不正確。

有人可以澄清嗎？

6 個解決方案

如果一個類不重寫hashCode() ，而只是從java.lang.Object繼承默認實現，那么在典型的JVM中，其hashCode()實際上或多或少是指向它的內部指針。 （顯然，這不是全部，因為hashCode()的返回類型是int ，它不能容納64位JVM；而且這些也不是指向物理內存位置的真正指針，首先是因為OS處理了來自虛擬地址到物理地址，其次，因為即使JVM處理了，垃圾回收器也可以將對象從一個堆移到另一個堆，而不會影響其hashCode() ，但是“內部內存地址”仍然是一個很好的第一近似值。）

大多數JDK類重寫hashCode()是，我們始終希望hashCode()與equals() “兼容”； 也就是說，如果a.equals(b) ，那么我們需要a.hashCode() == b.hashCode() 。 （這在您認為您通常不希望（例如，一個Map<String, Object>僅僅具有兩個不同的String實例的鍵）具有兩個不同的"abc"條目時才有意義。通常，您希望能夠通過鍵入map.get("abc")來查找條目，而不需要map.get("abc")獲取鍵的原始實例。如果兩個鍵相等，那么我們通常希望將它們視為相等。）

如果您確實想在地圖中使用指針相等，則可以使用java.util.IdentityHashMap類。

默認的Object.hashCode()嚴格來說不是內存地址，但是除非您有巨大的內存，否則它在JVM中的所有對象中確實是唯一的，因此您可以將其視為“邏輯”地址。

HashMap具有有限數量的存儲桶，每個鍵的確根據其哈希碼分配了存儲桶。 每個哈希碼沒有一個存儲桶。 因此，即使兩個對象具有不同的哈希碼，它們也可能以相同的桶結尾。 這就是為什么必須盡可能合理地分布hashCode以避免這種沖突的原因。

在大多數情況下，不希望使用鍵的系統標識哈希碼（即Object.hashCode()返回的哈希碼Object.hashCode() ，因為如果兩個鍵具有相同的信息，而不是兩個鍵，則希望它們相等。同一對象實例。例如，如果您將一個學生存儲在基於他的SSN的地圖中，然后從某個Web服務或數據庫中獲取該學生的SSN，則您將沒有相同的STring實例，但是您希望能夠使用收到的SSN在地圖上找到學生。