如何使用Lucene索引和搜索结构文本文件？

Question

这是我第一次使用Lucene，并且我有一个像这样的文本文件：

id,name,address,hobby
1,namm1,address1,football
2,namm2,address2,football
3,namm3,address3,football
4,namm4,address4,football
5,namm5,address5,football
6,namm6,address6,basketball
7,namm7,address7,basketball
8,namm8,address1,football
9,namm9,address8,swimming
...

上面的文件是一个包含1,000,000行的文本文件。 现在，我想从文件中找到地址为address1且其爱好是football的记录，然后将记录放入另一个文件中，如下所示：

1,namm1,address1,football
8,namm8,address1,football
...

第一个文件非常大，因此一个接一个地查找记录会非常慢。 我想为Lucene的第一个文件建立索引（根据地址和爱好）。 然后，我可以快速找到地址为address1且兴趣爱好为football的记录，并将其放入新文件中。 我从未用Lucene编程。 谁能给我一个类似的例子？

Answer 1

这很简单。 使用Lucene索引文件时，可以定义自己的“分析器”。 简而言之，分析器从源中提取信息并将其放入Lucene“文档”的“字段”中。

搜索内容时，可以定义Lucene应该考虑的字段。

因此，根据您的情况，解决方案是编写一个分析器，将每一列放入一个字段中。 使用MultiFieldQueryParser并在查询中指定字段名称。 对于您的示例，查询将是

address:address1 hobby:football

Answer 2

我认为他根本不需要编写分析器，他可以使用许多内置分析器之一，使用Java代码来解析每一行并将每个值放入相应的字段中

如何使用Lucene索引和搜索结构文本文件？

问题描述

2 个解决方案

解决方案1
0 2012-06-30 19:51:47

解决方案2
0 2012-07-01 21:06:59

如何使用Lucene索引和搜索结构文本文件？

问题描述

2 个解决方案

解决方案1 0 2012-06-30 19:51:47

解决方案2 0 2012-07-01 21:06:59

解决方案1
0 2012-06-30 19:51:47

解决方案2
0 2012-07-01 21:06:59