繁体   English   中英

我们如何创建自定义solr索引和自定义lucen索引来搜索alfresco中的文档?

[英]How we can create custom solr indexing and custom lucen indexing to search documents in alfresco?

实际上我参加了一些关于露天的采访,但我常常得到如何创建自定义索引以及如何重新索引文档的问题。

我用谷歌搜索了它,但没有找到任何有用的答案,或者我仍然无法理解究竟是什么,怎么做?

任何人都可以通过我们必须为自定义索引编制的必要配置来帮助我理解这一点吗?

提前致谢

1 /让我们承认您创建了自己的模型,并希望选择如何自定义字段的索引

我的解释将基于这个页面: http//docs.alfresco.com/5.0/concepts/search-fts-config.html和mor这个部分:

数据字典选项

可以在内容模型中设置每个属性的索引行为。 默认情况下,它们以原子方式编制索引。 属性值不存储在索引中,并且在索引时对属性进行标记化。 以下示例显示了如何控制索引。

Enabled =“false”如果为false,则索引中不会有此属性的条目。

Atomic =“true”如果这是真的,则在事务中索引属性,否则属性在后台索引。

facetable =“true”如果为true,则该属性将用于构面,如果为false,则不能将其用于构面。

Tokenised =“true”如果为“true”,则在索引之前对属性的字符串值进行标记化。 如果为“false”,则将其“原样”索引为单个字符串。 如果“both”则两个指定的表单都在索引中。

基本上,如果enabled为true,则表示该字段可以搜索。

如果tokenized为true,则表示(简而言之)如果仅查看其中的一部分,则将返回您正在编制索引的字段:

如果是,将返回值为“Blue cat”的字段

  • 它被标记化并且查询单词“cat”或“blue”
  • 它没有被标记化,并且会询问确切的句子“蓝猫”。 通常,文档内容是标记化的,这就是为什么您无法通过他的内容找到文档,只需要几句话。

2 /让我们承认您要更改数据类型分析器:

对于每种数据类型,选择分析器来处理相应的字段。 您可以在这里查看配置文件: https//github.com/Alfresco/community-edition/tree/master/projects/system-build-test/config/alfresco/model

在默认配置文件(dataTypeAnalyzers.properties)中,您可以看到(例如)AlfrescoStandardAnalyser处理文本字段。 现在,由于我使用法语区域设置配置了我的Alfresco,我的露天将使用dataTypeAnalyzers_fr.properties文件覆盖此行为,因此文本字段将由FrenchAnalyzer处理。 这款分析仪对我来说更好,因为它可以处理一些法国特色。 如果需要,您可以使用雪球覆盖此分析器(具有不同的行为)。

3 /让我们承认您有技术需求,您想要自定义您的Solr配置

我的解释仍将基于此页面: http//docs.alfresco.com/5.0/concepts/search-fts-config.html

Solr 4索引属性

solr.host = localhost Solr实例所在的主机名。

solr.port = 8080正在运行Solr实例的端口号。

solr.port.ssl = 8443正在运行Solr SSL支持的端口号。

solr.solrUser = solr Solr用户名。

solr.solrPassword = solr Solr密码。

solr.secureComms = https HTTPS连接。

solr.solrConnectTimeout = 5000 Solr连接超时,以毫秒为单位。

solr.solrPingCronExpression = 0 0/5 * * *? * cron表达式定义了Solr Admin客户端(由JMX使用)在Solr 4消失时的频率。

如果需要,可以更改一些Solr参数。 我不会再进一步​​,因为我觉得这不是你想要的。

4 /对于reindex部分 ,我不会真正具体,因为Gagravarr已经为您提供了文档链接: http ://docs.alfresco.com/5.1/tasks/solr-reindex.html请记住,索引是可重新调整的,因此您只需删除索引文件夹即可开始重建索引。

我最后会说,我只涵盖了索引主题的一小部分。 由于这是一个巨大的领域,我们真的需要您指定您的需求,以便给您正确的答案。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM