簡體   English   中英

Lucene中的多詞組

[英]Multi-term phrases in Lucene

我正在閱讀《 Lucene in Action》一書,但我不理解多詞組部分。

索引了以下文本:

敏捷的棕色狐狸跳過了那只懶狗

然后,將以下術語添加到PhraseQueryPhraseQuery等於4的快速跳變懶惰 。這導致匹配,但是我不知道這是怎么發生的。 有多個條件時,如何計算移動次數? 我不明白他們是怎么做到的。

術語懶惰與坡度等於8時一樣快速跳躍

斜率實際上是一個編輯距離 在它們之間插入多余的術語會使距離加1,移置的術語會使距離加2(第一個編輯將兩個術語彼此疊加)。

您可以一次進行一次編輯以說明:

  • quick jumped lazy 距離:0
  • quick _ jumped lazy 距離:1
  • quick _ _ jumped lazy 距離:2
  • quick _ _ jumped _ lazy 距離:3
  • quick _ _ jumped _ _ lazy 距離:4

對於第二種情況:

  • lazy jumped quick 遠距離:0
  • lazy/jumped quick 距離:1
  • lazy/jumped/quick 距離:2 (所有三個項疊加在一起,在同一位置)
  • quick lazy/jumped 距離:3
  • quick jumped lazy 距離:4
  • quick _ jumped lazy 距離:5
  • quick _ _ jumped lazy 距離:6
  • quick _ _ jumped _ lazy 距離:7
  • quick _ _ jumped _ _ lazy 距離:8

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM