繁体   English   中英

更新Solr 6.6.0中字段的配置

[英]Update the configuration of a field in Solr 6.6.0

我正在使用Apache Solr 6.6.0,以便通过递归索引文件夹中的所有文件来构建搜索引擎。

我的操作如下:1)我基于云示例创建索引。 2)我索引给定文件夹中的所有文件。

bin\solr start -e cloud -noprompt
java -Dc=gettingstarted -Dauto=yes -Ddata=files -Drecursive=yes -jar example\exampledocs\post.jar <path_to_folder>

稍后,当我在用户界面中搜索查询时,我看到,即使它为我提供了最匹配的内容,也没有为我提供文档内容。 经过一番研究,我在托管模式文件中找到了一个名为“ _text_”的字段及其配置:

<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/>

如您所见,该字段未存储,我认为这是响应未提供内容的原因。

我在正确的轨道上吗? 如果是这样,我如何编辑该字段的配置? 我应该删除它并创建一个具有相同名称且具有storage = true的新文件吗?

谢谢。

不应将_text_字段存储,因为它用作“全部捕获”字段。 因此,首先,您应该检查Solr配置,以确保它仅包含文件内容。 如果是这样,则可以将该字段标记为已存储。

但是,通常来说,文件内容仅被索引而不被存储,因为

  • 为了让最终用户看到内容,GUI具有其他访问文件内容的方式(例如,通常将诸如txt文件之类的静态资源发布在单独的Apache实例中,因此从客户端的角度来看,这只是问题HTTP URL)
  • 它会大大增加您的索引大小

因此,换句话说:使用Solr进行搜索,一旦获得给定的项目元数据,就可以使用其标识符进入其他系统并“查看”相应的内容。 这是通常的情况,尤其是处理txt文件等非结构化数据时

  • “通常”并不意味着它总是有效的。 在某些情况下,您可能希望Solr做到这一点,或者总的来说,可能会有其他一些很好的理由将字段标记为已存储(例如,突出显示)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM