簡體   English   中英

計算2個句子之間的相似度

[英]Calculating the similarity between 2 sentences

我想計算2個句子之間的相似度,我需要一個百分比值來說明它們彼此匹配的程度。 像這樣的句子

1. The red fox is moving on the hill.
2. The black fox is moving in the bill.

我當時正在考慮Levenshtein distance但是我不確定,因為它說這是為了尋找“ 2個字”之間的相似性。 那么這個Levenshtein distance可以幫助我嗎?或者還有什么其他方法可以幫助我呢? 我將使用JavaScript。

嘗試此解決方案JS string diff

使用Jaccard索引 您可以找到任何語言的實現,包括JavaScript( 是一種,雖然沒有親自測試過)。

這是我會做的,具體取決於這有多重要。 如果是中到低優先級,這是一個簡單的算法。

  1. 掃描所有句子,查看單詞出現的頻率。
  2. 過濾掉最常見的單詞,例如30%的句子中的單詞,即不要計算這些單詞。 因此希望不會被計算在內。
  3. 然后做你的單詞比較。

但是,為什么要執行此操作的上下文非常重要。 也就是說,您提供給我們的示例可能是針對學習英語等的學生,也就是說,如果我嘗試查看人群中的用戶是否在描述同一段,而文章主題是否足夠相似以建議閱讀,那么我將使用不同的算法。

計算兩個句子相似度的常用方法是余弦相似度。 不知道JavaScript中是否存在實現。 余弦相似度僅針對單詞而不是單個字母。 該網站是完全explenations例如這里

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM