簡體 English 中英

Lucene 索引建模 - 為什么使用跳過列表而不是 btree？

[英]Lucene index modeling - Why are skiplists used instead of btree?

原文 2021-03-25 17:18:42 3 1 data-structures/ lucene/ skip-lists

我最近開始學習 lucene 並了解 lucene 如何存儲和查詢索引。 Lucene 似乎使用跳過列表作為基礎數據結構。 但是，我沒有找到任何理由在二叉樹上使用跳過列表。

跳過列表的優點是它在同時使用時提供了良好的性能。 並且 lucene 允許每個索引的單個寫入線程和讀取不可變段的讀取，因此跳過列表在這里也沒有幫助。 除了二叉樹（自平衡）勝過跳過列表 - 因為它為讀取和寫入提供了 O(logn) 的最壞情況復雜度，而跳過列表在平均情況下提供相同的時間復雜度。 此外，與跳過列表相比，二叉樹將在更好的時間內提供范圍查詢。 為了提供聯合查詢，lucene 使用多個發布列表的跳過列表來查找它們的交集 - 對於這種情況，二叉樹就足夠了。

是否有任何特定原因在 lucene 中使用跳過列表用於我錯過的索引目的？

1 個解決方案

Lucene 使用磁盤上的 Skip-Lists 構建倒排索引，然后使用有限 State 傳感器將索引項的映射加載到 memory 中。 請參閱此 SO 答案以了解 lucene 如何索引文檔？

在那個答案中，它還表明使用 Skip- Lists的主要好處是它避免了重新平衡 B-Tree。 如果您想更深入地挖掘該答案，請引用另一個提供更多詳細信息的答案： Skip List vs. Binary Search Tree實習生參考了其他白皮書。

對此進行更多研究，使用 Skip-Lists 而不是 BTree 還有另一個優點。 不僅避免了重新平衡，而且還避免了在重新平衡發生時鎖定樹的一部分。 這方面將在此處進一步討論。 后一個優點提高了並發性。

PST 文件中使用的這個“BTree”變體是什么？

[英]What is this "BTree" variant being used in PST files?

混合的“類似索引”的btree結構-PostgreSQL可以做到嗎？

[英]Hybrid “Index-like” btree structure - can PostgreSQL do this?

為什么該程序的空間復雜度為O（h）？其中h是btree的高度

[英]Why is the space complexity of this program O(h)? Where h is height of btree

[英]Btree implementation

平衡二叉樹與索引跳過列表

[英]Balanced binary trees versus indexed skiplists

如何實現Btree的迭代器？

[英]How to implement iterator of Btree?

從排序數組構造 BTree

[英]Construct a BTree from a sorted array

BTree中的二分搜索以提高性能

[英]Binary search within BTree to improve performance

Node JS在索引而不是索引處顯示值

[英]Node JS displaying value at index instead of indices

Python建模樹

[英]Python modeling Tree

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 PST 文件中使用的這個“BTree”變體是什么？混合的“類似索引”的btree結構-PostgreSQL可以做到嗎？為什么該程序的空間復雜度為O（h）？其中h是btree的高度 Btree實現平衡二叉樹與索引跳過列表如何實現Btree的迭代器？從排序數組構造 BTree BTree中的二分搜索以提高性能 Node JS在索引而不是索引處顯示值 Python建模樹

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM