繁体   English   中英

SOLR模式-文档ID字段的存储。 Lucene索引中的最大文档数

[英]SOLR schema - storing of document Id field. Maximum number of documents in Lucene index

我有一些关于Lucene / SOLR索引架构的问题

  1. 这是我在SOLR模式中定义的文档ID字段(UniqueKey):

    <field name =“ Id” type =“ long” indexed =“ true”存储=“ true”必需=“ true” />

我将永远不会通过ID字段执行搜索,因此是否需要将其索引为“ true”? 顺便说一句,是否需要将它存储为“ true”(我想还是会存储它,所以没关系)。

2:单个SOLR索引中最多可以存储多少个文档? 或者,更准确地说:它可以容纳50亿个小文件吗?

第三个问题:我需要对2个字段进行组合搜索:其中一个是long类型,另一个是整数。 存储和索引这些字段的最有效方法是-分别存储和索引它们,或者根据它们两者预先计算一些哈希值,然后仅通过哈希搜索? 由于我想拥有数十亿个这样的文档,因此我需要在保持搜索效率的同时最大程度地减少存储需求。

谢谢RG

  1. http://wiki.apache.org/solr/SchemaXml#The_Unique_Key_Field

    架构具有uniqueKey字段不是强制性的

  2. Solr最多可容纳约2,740亿个文档。 处理和搜索响应将取决于内存。 但是,如果索引大小增加并且无法维护,则可以使用Distributed Search

  3. 您可以将字段组合为单个字段作为哈希,而不是将其标记为已存储以减小索引大小。 这样可以加快初始搜索的速度。 缓存应注意类似的搜索。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM