[英]How to implement a phonetic search using Lucene?
我想使用Lucene 6.1.0,使用Soundex或葡萄牙語的任何合適算法來實現語音搜索。 我在互聯網上發現了許多不完整的示例,他們在教如何實現自定義標記器,分析器,但是似乎這些示例中使用的抽象類在6.1.0版本中是不同的。 誰能指出我在哪里可以找到Lucene的優質文檔,而不僅僅是Java文檔,而沒有任何進一步的文檔講授如何將它們組合在一起的文檔?
提前致謝。
分析器文檔顯示了如何創建分析器。
對於語音分析,您應該查看org.apache.lucene.analysis.phonetic軟件包(您需要在構建路徑中添加“ lucene-analyzers-phonetic-6.1.0.jar”,以及Apache的“ commons”)。 -codec-1.10.jar”,您可以在此處獲取 )。
然后,您可以設置分析儀,例如:
Analyzer analyzer = new Analyzer() {
@Override
protected TokenStreamComponents createComponents(String fieldName) {
Tokenizer tokenizer = new StandardTokenizer();
TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false);
return new TokenStreamComponents(tokenizer, stream);
}
};
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.