Lucene样本查询

Question

当我通过短语“ ph1 ph2”搜索时，它会找到包含“ ph1”或“ ph2”的文本。

String line = "ph1 ph2";           
QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, field, analyzer);
Query query = parser.parse(line);

任何人都知道如何通过1）短语（“ ph1 ph2”）进行搜索。 示例：这是句子ph1 ph2。 2）具有最大距离的词组（“ ph1 ph2〜3”）。 示例此ph1是句子ph2。

PS我使用标准的Lucene Indexer来索引我的文件。 如果此示例不清楚，请查看http://www.lucenetutorial.com/lucene-query-syntax.html

这是完整的代码：

String index = "C:/programs/lucenedemo/index";
    String field = "contents";                    
    IndexReader reader = DirectoryReader.open(FSDirectory.open(new File(index)));
    IndexSearcher searcher = new IndexSearcher(reader);
    Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_40);
    //QueryParser parser = new QueryParser(Version.LUCENE_40, field, analyzer);          
    String line = "ph1 ph2";           
    QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, field, analyzer);
    Query query = parser.parse(line);                     
    //doPagingSearch(searcher, query, hitsPerPage, raw, queries == null && queryString == null);         
    //doPagingSearch

    TopDocs results = searcher.search(query, 300000);
    ScoreDoc[] hits = results.scoreDocs;        
    System.out.println(results.totalHits);

    for (int i=0;i<10;i++) {    
    Document doc = searcher.doc(hits[i].doc);
        String path = doc.get("path");
        if (path != null) System.out.println((i+1) + ". " + path);                          
    } 

    //end of doPagingSearch
    reader.close();

Answer 1

您可能要使用SpanQuery。

具体来说，您可以创建一个SpanNearQuey，向构造函数传递一个SpanTermQuerys数组，一个用于短语中的每个子句，一个int表示“ slope”或最大距离（以及一个布尔值，指示术语是否必须按顺序排列））。

要进行搜索，请对您创建的查询使用getSpans方法。

请注意，这将为您提供所有此类事件的列表，而不是匹配文档的列表。 根据您想要呈现结果的方式，您可能需要遍历跨度并根据文档等对它们进行分组。

Answer 2

我不清楚您要寻找的是什么，但我相信它是以下之一：

"field:\\"" + line + "\\"" ：简单短语查询。 查找两个相邻的有序术语
"field:\\"" + line + "\\"~3" 〜3 "field:\\"" + line + "\\"~3" ：带斜率的词组查询。 按顺序排列，但在两个术语中最多具有三个值得分离的术语。
"field:(" + line + ")" ：根本不是短语查询。 简单搜索两个术语。 任何顺序或距离都是可以接受的。

您可以在Lucene的查询语法文档中查看有关查询解析器语法的更多选项。

Lucene样本查询

问题描述

2 个解决方案

解决方案1
1 2013-08-19 14:05:42

解决方案2
1 2013-08-19 16:41:35

Lucene样本查询

问题描述

2 个解决方案

解决方案1 1 2013-08-19 14:05:42

解决方案2 1 2013-08-19 16:41:35

解决方案1
1 2013-08-19 14:05:42

解决方案2
1 2013-08-19 16:41:35