簡體   English   中英

如何使用Lucene進行語音搜索?

[英]How to implement a phonetic search using Lucene?

我想使用Lucene 6.1.0,使用Soundex或葡萄牙語的任何合適算法來實現語音搜索。 我在互聯網上發現了許多不完整的示例,他們在教如何實現自定義標記器,分析器,但是似乎這些示例中使用的抽象類在6.1.0版本中是不同的。 誰能指出我在哪里可以找到Lucene的優質文檔,而不僅僅是Java文檔,而沒有任何進一步的文檔講授如何將它們組合在一起的文檔?

提前致謝。

分析器文檔顯示了如何創建分析器。

對於語音分析,您應該查看org.apache.lucene.analysis.phonetic軟件包(您需要在構建路徑中添加“ lucene-analyzers-phonetic-6.1.0.jar”,以及Apache的“ commons”)。 -codec-1.10.jar”,您可以在此處獲取 )。

然后,您可以設置分析儀,例如:

Analyzer analyzer = new Analyzer() {
    @Override
    protected TokenStreamComponents createComponents(String fieldName) {
        Tokenizer tokenizer = new StandardTokenizer();
        TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false);
        return new TokenStreamComponents(tokenizer, stream);
    }
};

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM