簡體 English 中英

用於經常更改的文檔的Lucene索引策略

[英]Lucene indexing strategy for documents that change often

原文 2011-05-16 00:21:25 4 2 java/ lucene

我正在將搜索功能集成到桌面應用程序中，並且正在使用香草Lucene。 該應用程序處理（可能是數千個）POJO，每個POJO都具有自己的一組鍵/值屬性。 當在我的應用程序和Lucene之間映射模型時，我最初想到為每個POJO分配一個Document並將這些屬性添加為Fields。 這種方法在進行索引和搜索時效果很好，但主要缺點是，每當POJO更改其屬性時，我都必須再次重新索引所有屬性，即使是未更改的屬性，也要更新索引。 我一直在考慮改變我的方法，而是為每個屬性創建一個Document，並為同一POJO中的所有Document分配相同的ID。 這樣，當POJO屬性發生更改時，我只會更新其相應的Document，而不會為所有其他未更改的屬性重新編制索引。 我認為圖db Neo4J在建立索引時遵循類似的方法，但是我不確定。 誰能評論對性能，查詢等可能造成的影響？

2 個解決方案

從根本上說，這取決於您要在搜索結果中作為文檔返回的內容。

但是索引很便宜。 更改后的POJO是否真的具有這么多的屬性，以至於全部重新編制索引是一個主要問題？

如果在每個搜索請求中僅搜索一個字段，則將一個POJO拆分為多個文檔將加快重新索引的速度。 但是，如果搜索多個字段，將導致另一個問題，POJO可能會出現多次。 實際上，我同意EJP，在小型數據集中構建索引非常快。

Lucene索引HTML文檔

[英]Lucene indexing html documents

Lucene 5.5.3具有遞歸前綴樹策略的空間索引

[英]Lucene 5.5.3 spatial indexing with Recursive Prefix Tree strategy

我可以使用Lucene Search索引和搜索泰米爾語文檔嗎？

[英]Can i use Lucene Search for indexing and Searching Tamil Documents?

使用Lucene使用SnowballAnalyzer清理文本以索引文本文檔時發生異常

[英]Exception when indexing text documents with Lucene, using SnowballAnalyzer for cleaning up

Lucene：基於字典術語為文檔建立索引/實現自定義分析器

[英]Lucene: indexing documents based on dictionary terms/ implementing custom Analyzer

使用Lucene進行索引時如何將JSON對象視為單獨的文檔

[英]How to treat JSON objects as separate documents while indexing using Lucene

Neo4j節點索引：如何更改Lucene的默認相似度？

[英]Neo4j node indexing: how to change Lucene default similarity?

Lucene的索引和搜索日期

[英]Indexing and Searching Date in Lucene

Apache Lucene中的索引性能

[英]Indexing Performance in Apache Lucene

Apache Lucene索引

[英]Apache lucene indexing

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Lucene索引HTML文檔 Lucene 5.5.3具有遞歸前綴樹策略的空間索引我可以使用Lucene Search索引和搜索泰米爾語文檔嗎？使用Lucene使用SnowballAnalyzer清理文本以索引文本文檔時發生異常 Lucene：基於字典術語為文檔建立索引/實現自定義分析器使用Lucene進行索引時如何將JSON對象視為單獨的文檔 Neo4j節點索引：如何更改Lucene的默認相似度？ Lucene的索引和搜索日期 Apache Lucene中的索引性能 Apache Lucene索引

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM