我在這個布隆過濾器實現中做錯了什么？

Question

我有這個位表用於分段布隆過濾器。 這里每列都由一個哈希函數管理。

unsigned char bit_table_[ROWS][COLUMNS];//bit_table now have 8*ROWS*COLUMNS bits
unsigned char bit_mask[bits_per_char] = { 0x01,0x02,0x04,0x08,
                                          0x10,0x20,0x40,0x80};

有ROWS個哈希函數，每個哈希函數處理COLUMNS * 8位的設置和檢查。

元素經過哈希處理， bit_index和bit計算為

compute_indices(unsigned int hash)
{
   bit_index=hash%COLUMNS;
   bit=bit_index%8;
}

現在就完成了攝制

for (std::size_t i = 0; i < ROWS; ++i)
      {
        hash=compute_hash(i,set_element);
        compute_indices(hash);
        bit_table_[i][bit_index ] |= bit_mask[bit]; 
      }

而查詢是

for (std::size_t i = 0; i < ROWS; ++i)
      {
     hash=compute_hash(i,set_element);
      compute_indices(hash);

      if (((bit_table_[i][bit_index])& bit_mask[bit]) != bit_mask[bit])
         {
            return false;
         }      
  }

我的問題是布隆過濾器太快就滿了，我懷疑我沒有正確使用字符的各個位。 例如，我想我應該有類似的東西：

bit_table_ [I] [bit_index] [比特] | = BIT_MASK [比特];

插入但是，由於bit_table被聲明為二維數組，我不允許這樣做。

我該怎么做才能利用char數組的各個位？

英語是我的第二語言，所以你可能無法理解我的問題。 如果有要求，我會很樂意解釋我的觀點。

編輯： compute_hash（i，set_elemnt）使用預定義的salt值來計算要插入或查詢的元素的哈希值。

Answer 1

您的compute_indices方法中存在錯誤。

您正在計算列索引，然后在此列索引上應用模8。 最后，您將始終在列中使用相同的位。 例如，對於列10，您將始終使用位2。

你應該有：

compute_indices(unsigned int hash)
{
    int bitIndex = hash % (COLUMNS * 8);
    bit_index= bitIndex / 8;
    bit = bitIndex % 8;
}

我在這個布隆過濾器實現中做錯了什么？

問題描述

1 個解決方案

解決方案1
1 2012-05-05 15:34:31

我在這個布隆過濾器實現中做錯了什么？

問題描述

1 個解決方案

解決方案1 1 2012-05-05 15:34:31

解決方案1
1 2012-05-05 15:34:31