簡體   English   中英

非常基本的MurmurHash問題:len的變量描述,C ++實現中的關鍵

[英]Very basic MurmurHash questions: variable descriptions for len, key in C++ implementation

我正在嘗試將MurmurHash改編為為類構建的程序,但似乎找不到關於變量代表什么的明確確認。

我使用以下作為參考:

unsigned int MurmurHash2 ( const void * key, int len, unsigned int seed )
{
    // 'm' and 'r' are mixing constants generated offline.
    // They're not really 'magic', they just happen to work well.

    const unsigned int m = 0x5bd1e995;
    const int r = 24;

    // Initialize the hash to a 'random' value

    unsigned int h = seed ^ len;

    // Mix 4 bytes at a time into the hash

    const unsigned char * data = (const unsigned char *)key;

    while(len >= 4)
    {
        unsigned int k = *(unsigned int *)data;

        k *= m; 
        k ^= k >> r; 
        k *= m; 

        h *= m; 
        h ^= k;

        data += 4;
        len -= 4;
    }

    // Handle the last few bytes of the input array

    switch(len)
    {
    case 3: h ^= data[2] << 16;
    case 2: h ^= data[1] << 8;
    case 1: h ^= data[0];
            h *= m;
    };

    // Do a few final mixes of the hash to ensure the last few
    // bytes are well-incorporated.

    h ^= h >> 13;
    h *= m;
    h ^= h >> 15;

    return h;
} 

據我了解,哈希函數將獲取一些值並將其放入哈希表中。 “ len”是哈希表的大小,“ key”是要哈希的值嗎?

它們代表的是以下內容:

unsigned int MurmurHash2 ( const void * key, int len, unsigned int seed )

key -指向一個字節數組,要生成一個散列值

len key指向的字節數(或至少是要包含在計算哈希值的輸入中的字節數)

seed -選擇您想要的任何價值; 如果您使用不同的種子值,則對於給定的輸入,您將獲得不同的哈希碼。 如有疑問,請始終輸入零。

返回根據傳入的字節計算得出的哈希值。 對於相同的字節序列,您將始終獲得相同的哈希值(假設您還傳遞了相同的seed值),但是對於不同的字節序列,返回的哈希值將有很大的不同(即,即使輸入有很小的差異)個字節可能會導致返回的哈希值非常不同)

據我了解,哈希函數將獲取一些值並將其放入哈希表中。 “ len”是哈希表的大小,“ key”是要哈希的值嗎?

不對 MurmurHash2()僅計算哈希碼,因此MurmurHash2()作為哈希表實現的一部分可能很有用,但它本身並不實現哈希表。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM