[英]Solr's schema and how it works
嘿,所以我开始研究Solr,并对Solr的工作方式有两个疑问。 我知道架构定义了在Solr应用程序中存储和索引的内容。 但是我对Solr如何知道“内容”是网站的内容还是URL是URL感到困惑。
我的主要目标是我试图从网站中提取电话号码,我希望Solr很好地吐出1234567890。
您需要通过声明所有字段及其字段类型在Solr schema.xml中对其进行定义。 然后,您可以查询Solr以搜索任何字段。
Solr不会自动将网站内容编入索引。 您需要告诉它如何索引内容。 Solr只知道您告诉它的内容。 提取电话号码听起来很简单,因此编写更新脚本或在线查找一个脚本应该不是问题。 祝好运!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.