簡體   English   中英

SOLR模式-文檔ID字段的存儲。 Lucene索引中的最大文檔數

[英]SOLR schema - storing of document Id field. Maximum number of documents in Lucene index

我有一些關於Lucene / SOLR索引架構的問題

  1. 這是我在SOLR模式中定義的文檔ID字段(UniqueKey):

    <field name =“ Id” type =“ long” indexed =“ true”存儲=“ true”必需=“ true” />

我將永遠不會通過ID字段執行搜索,因此是否需要將其索引為“ true”? 順便說一句,是否需要將它存儲為“ true”(我想還是會存儲它,所以沒關系)。

2:單個SOLR索引中最多可以存儲多少個文檔? 或者,更准確地說:它可以容納50億個小文件嗎?

第三個問題:我需要對2個字段進行組合搜索:其中一個是long類型,另一個是整數。 存儲和索引這些字段的最有效方法是-分別存儲和索引它們,或者根據它們兩者預先計算一些哈希值,然后僅通過哈希搜索? 由於我想擁有數十億個這樣的文檔,因此我需要在保持搜索效率的同時最大程度地減少存儲需求。

謝謝RG

  1. http://wiki.apache.org/solr/SchemaXml#The_Unique_Key_Field

    架構具有uniqueKey字段不是強制性的

  2. Solr最多可容納約2,740億個文檔。 處理和搜索響應將取決於內存。 但是,如果索引大小增加並且無法維護,則可以使用Distributed Search

  3. 您可以將字段組合為單個字段作為哈希,而不是將其標記為已存儲以減小索引大小。 這樣可以加快初始搜索的速度。 緩存應注意類似的搜索。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM