繁体 English 中英

Solr模式设计和性能

[英]Solr schema design and performance

原文 2014-09-27 21:31:40 2 1 solr

我有一个包含三个实体的图书数据库：图书，页面和标题（在页面中找到的标题）。 我对模式设计中两种方法之间的性能感到困惑和担忧：

1-将书籍作为文档处理，即书籍字段，具有multiValue的页面字段和具有multiValue的书名字段。 通过这种方法，所有书籍数据都将在一个Solr文档中以非常大的字段表示。

2-将页面作为文档处理，这将导致较小的字段，但会导致大量的文档。

我试图查看此官方资源，但无法为我的问题找到明确的答案。

1 个解决方案

假设您要获取Solr结果并通过另一个应用程序显示，我将使用最小的项-标题-文档模型，这将使显示结果出现的位置更加容易。 这样做可以最大程度地减少您需要编写的应用程序代码量。 如果您的用户直接查询Solr，则我可以改用Page作为我的文档-大概您是在使用Solr的突出显示功能，然后帮助您的用户确定其搜索词的匹配方式。

对于标题文档，我将按以下方式对模式进行建模：

图书ID +页码+标题[字符串-唯一键]
图书ID [整数]
图书名称[标记的文本字段]
页码[TrieIntField]
标题[标记的文本字段]
该书/标题/页面组合的内容[标记的文本字段]

您可能还需要捕获其他属性，例如作者，发布日期，发布者，但是您在上面没有解释其他信息，因此我将其排除在本示例之外。

然后，文本查询可能涉及Book Name Title Book Name ，“ Title和“ Content ，您可能希望在其中定义一个已索引但未存储的字段，该字段用作schema.xml中<copyField/>声明的目标，以便于轻松搜索所有内容。三个同时。

对于索引，在不了解更多有关要索引的数据的情况下，我将使用ICU Tokenizer和Snowball Porter词干过滤器，并在文本字段上使用语言规范来处理非英语数据-假设所有书籍都使用同一语言。 如果是英语，则使用标准标记器而不是ICU。

设计最佳的Solr模式

[英]Design optimal Solr Schema

Solr架构设计

[英]Solr Schema Design

SOLR架构设计和搜索

[英]SOLR schema design and searching

solr 100 多个表的模式设计

[英]solr schema design for 100 over tables

solr模式设计，用于多对多的实体定义

[英]solr schema design for many to many entity definitions

Solr架构设计：拟合时间序列数据

[英]Solr schema design: fitting time-series data

将solr 4模式应用于solr 6

[英]Apply solr 4 schema to solr 6

[英]SOLR performance

Solr托管模式“为获得最佳索引大小和搜索性能，请将“ index”设置为false”。为什么？

[英]Solr managed-schema 'for best index size and searching performance, set “index” to false'. Why?

范围值的Solr模式

[英]Solr schema for range values

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 设计最佳的Solr模式 Solr架构设计 SOLR架构设计和搜索 solr 100 多个表的模式设计 solr模式设计，用于多对多的实体定义 Solr架构设计：拟合时间序列数据将solr 4模式应用于solr 6 SOLR性能 Solr托管模式“为获得最佳索引大小和搜索性能，请将“ index”设置为false”。为什么？范围值的Solr模式

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM