[英]How to use QueryParser for Lucene range queries (IntPoint/LongPoint)
[英]Lucene LongPoint Range search doesn't work
我在 Java 11 中使用 Lucene 8.2.0。
我正在尝试索引一个Long
值,以便我可以使用范围查询对其进行过滤,例如: +my_range_field:[1 TO 200]
。 但是,在这个最小示例中,它的任何变体,甚至my_range_field:[* TO *]
都会返回0
结果。 一旦我从中删除+
使其成为OR
,我就会得到2
结果。
所以我想我一定在索引它的方式上犯了一个错误,但我无法弄清楚它可能是什么。
来自LongPoint
JavaDoc :
用于快速范围过滤器的索引长字段。 如果您还需要存储该值,则应添加一个单独的 StoredField 实例。 在搜索时查找 N 维形状或范围内的所有文档是高效的。 允许一个文档中同一字段的多个值。
这是我的最小示例:
public static void main(String[] args) {
Directory index = new RAMDirectory();
StandardAnalyzer analyzer = new StandardAnalyzer();
try {
IndexWriter indexWriter = new IndexWriter(index, new IndexWriterConfig(analyzer));
Document document1= new Document();
Document document2= new Document();
document1.add(new LongPoint("my_range_field", 10));
document1.add(new StoredField("my_range_field", 10));
document2.add(new LongPoint("my_range_field", 100));
document2.add(new StoredField("my_range_field", 100));
document1.add(new TextField("my_text_field", "test content 1", Field.Store.YES));
document2.add(new TextField("my_text_field", "test content 2", Field.Store.YES));
indexWriter.deleteAll();
indexWriter.commit();
indexWriter.addDocument(document1);
indexWriter.addDocument(document2);
indexWriter.commit();
indexWriter.close();
QueryParser parser = new QueryParser("text", analyzer);
IndexSearcher indexSearcher = new IndexSearcher(DirectoryReader.open(index));
String luceneQuery = "+my_text_field:test* +my_range_field:[1 TO 200]";
Query query = parser.parse(luceneQuery);
System.out.println(indexSearcher.search(query, 10).totalHits.value);
} catch (IOException e) {
} catch (ParseException e) {
}
}
您需要首先使用 StandardQueryParser,然后为解析器提供 PointsConfig map,本质上是暗示哪些字段将被视为点。 您现在将获得 2 个结果。
// Change this line to the following
StandardQueryParser parser = new StandardQueryParser(analyzer);
IndexSearcher indexSearcher = new IndexSearcher(DirectoryReader.open(dir));
/* Added code */
PointsConfig longConfig = new PointsConfig(new DecimalFormat(), Long.class);
Map<String, PointsConfig> pointsConfigMap = new HashMap<>();
pointsConfigMap.put("my_range_field", longConfig);
parser.setPointsConfigMap(pointsConfigMap);
/* End of added code */
String luceneQuery = "+my_text_field:test* +my_range_field:[1 TO 200]";
// Change the query to the following
Query query = parser.parse(luceneQuery, "text");
我找到了解决我的问题的方法。
我的印象是查询解析器可以正确解析任何查询字符串。 情况似乎并非如此。
使用
Query rangeQuery = LongPoint.newRangeQuery("my_range_field", 1L, 11L);
Query searchQuery = new WildcardQuery(new Term("my_text_field", "test*"));
Query build = new BooleanQuery.Builder()
.add(searchQuery, BooleanClause.Occur.MUST)
.add(rangeQuery, BooleanClause.Occur.MUST)
.build();
返回了正确的结果。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.