![](/img/trans.png)
[英]How can I get Apache Solr to match documents that only contain some of the search terms?
[英]How can I match subdomains in a solr search?
我可以使用ClassicAnalyzer找到域。
給定一個具有諸如facebook.com之類的域的文檔,匹配諸如以下查詢之類的最佳方法是什么
可以組合使用分析儀(令牌化器,過濾器...)或構建自己的方法的任何組合。
謝謝!
我認為在這種情況下StandardTokenizer會更好。 它將Internet域名和電子郵件地址保留為單個令牌。 如果您發布了示例文檔以及您想匹配的幾個搜索字詞,它會有所幫助。
更新:查看text_general字段類型,它確實滿足您的需求。 我對xyz.facebook.com,faceboook.com,abc.xyz.facebook.com和facebook進行了分析,結果將它們每個都組合在一起並符合您想要的方式。
我結束了使用PatternCaptureGroupFilter和類似[[a-zA-Z \\ -_ 0-9] +)的模式
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.