繁体   English   中英

Solr的架构及其运作方式

[英]Solr's schema and how it works

嘿,所以我开始研究Solr,并对Solr的工作方式有两个疑问。 我知道架构定义了在Solr应用程序中存储和索引的内容。 但是我对Solr如何知道“内容”是网站的内容还是URL是URL感到困惑。

我的主要目标是我试图从网站中提取电话号码,我希望Solr很好地吐出1234567890。

您需要通过声明所有字段及其字段类型在Solr schema.xml中对其进行定义。 然后,您可以查询Solr以搜索任何字段。

引用此: http : //wiki.apache.org/solr/SchemaXml

Solr不会自动将网站内容编入索引。 您需要告诉它如何索引内容。 Solr只知道您告诉它的内容。 提取电话号码听起来很简单,因此编写更新脚本或在线查找一个脚本应该不是问题。 祝好运!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM