繁体   English   中英

Apache Solr中的自定义索引

[英]Custom index in Apache Solr

假设除了简单的文本术语,我还想从文本中检索一些复杂的数据。 例如,文本可以包含某种格式的图形描述。 之后,我想进行查询,在这些图形上包含一些条件(例如,我想找到所有带有平面图形或类似图形的文档)。 Solr的标准索引似乎不足以完成此类任务,因为(据我所知)最后,Solr的标准索引以字符串形式的标记来处理文档,但是我需要具有更合适格式的其他索引。 所以问题是:我可以以某种方式自定义索引并从Solr中的索引中检索数据吗? 我已经阅读了很多文档,但是找不到答案。

是。 您可以在schema.xml文件中定义每个字段。 在该文件中,您可以定义存储什么类型的数据,如何对文档进行标记化以及如何处理标记化数据。 为了满足您的需求,您可能需要编写一个自定义标记器和可能的自定义过滤器。

最好的起点是查看模式中text_general的字段定义。 它具有各种标记器,适用于文本的过滤器并帮助您建立索引。 您可以在索引编制和查询过程中定义不同的令牌。

您需要知道,标记应用于文本,过滤器应用于每个标记。 您具有某种格式的图形描述 您能否详细说明哪种格式,以便我们考虑更好的方法? 现有太多的令牌处理器和过滤器。 根据格式,您可以使用现有格式或编写自己的格式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM