[英]Multi-term phrases in Lucene
我正在閱讀《 Lucene in Action》一書,但我不理解多詞組部分。
索引了以下文本:
敏捷的棕色狐狸跳過了那只懶狗
然后,將以下術語添加到PhraseQuery
: PhraseQuery
等於4的快速跳變懶惰 。這導致匹配,但是我不知道這是怎么發生的。 有多個條件時,如何計算移動次數? 我不明白他們是怎么做到的。
術語懶惰與坡度等於8時一樣快速跳躍 。
斜率實際上是一個編輯距離 。 在它們之間插入多余的術語會使距離加1,移置的術語會使距離加2(第一個編輯將兩個術語彼此疊加)。
您可以一次進行一次編輯以說明:
quick jumped lazy
距離:0 quick _ jumped lazy
距離:1 quick _ _ jumped lazy
距離:2 quick _ _ jumped _ lazy
距離:3 quick _ _ jumped _ _ lazy
距離:4 對於第二種情況:
lazy jumped quick
遠距離:0 lazy/jumped quick
距離:1 lazy/jumped/quick
距離:2 (所有三個項疊加在一起,在同一位置) quick lazy/jumped
距離:3 quick jumped lazy
距離:4 quick _ jumped lazy
距離:5 quick _ _ jumped lazy
距離:6 quick _ _ jumped _ lazy
距離:7 quick _ _ jumped _ _ lazy
距離:8
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.