![](/img/trans.png)
[英]Unable to create index file using solr and haystack and django in windows
[英]Building a solr index using large text file
我有以下格式的大文本文件:
00001,234234|234|235|7345
00005,788|298|234|735
您可以先治疗价值,
如钥匙和我想要做的是快速和肮脏的方法来查询这些键,找到结果集为每个键。 阅读一番后,我发现solr提供了一个很好的框架来执行此操作。
您绝对可以使用pysolr(一个python库)来做到这一点。 如果数据为键值形式,则可以在python中读取,如下所示: https : //pypi.python.org/pypi/pysolr/3.1.0
为了更好地控制搜索,您需要修改schema.xml文件,使其具有与文本文件相同的键。
将数据吸收到SOLR中后,您可以按照上面的链接进行搜索。
您可以使用UpdateCSV
处理程序在Solr中直接为数据建立索引:您只需在curl调用的fieldnames
参数中指定目标字段名称(或将它们添加为文件中的第一行即可)。 无需自定义代码。
切记检查一下|
的目标字段。 -分隔的值使用该字符拆分为标记。
有关详细信息,请参见https://wiki.apache.org/solr/UpdateCSV 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.