簡體 English 中英

詞/句相似度。最好的方法是什么？

[英]Word/Sentence similarity. What is the best approach?

原文 2019-07-31 03:16:24 2 1 python/ nlp

我需要為產品主數據目的構建一個算法，但我不確定最好的 NLP 方法。 場景是： - 我有產品黃金記錄； - 我還有很多其他的產品目錄需要統一； 示例： - 產品黃金記錄：可樂和可樂零； - 需要協調的產品描述：可樂300ml、可樂零300ml、可樂零。

我需要一個通過相似性進行協調的算法，因為我必須考慮拼寫錯誤，有時還要考慮句子中的某個產品。 例子：可樂零JS MKT（JS和MKT都是垃圾，但句子更像可樂零）。

我一直在測試一些 NLP 的句子相似性，例如 Bag of words 以及閱讀其他一些方法，例如 Cosine Similarity 和 Levenshtein distance。 但是，我不知道什么是我的情況的最佳選擇。

您能否幫助我了解實現我所需要的最佳方法？

1 個解決方案

通過使用余弦相似度和 Levenshtein 距離，我找到了兩個很好的解決方案。 我的情況是，余弦相似度效果更好，因為我很容易在文本中找到品牌名稱的一部分，因此獲得了 100% 的准確率。 矩陣替換 (Levenshtein) 也不錯，但由於數據集中的單詞非常相似，我糾正了一些錯誤。

使用詞嵌入的句子相似度

[英]sentence similarity using word embedding

在 python 中測量多種語言文本之間相似性的最佳方法是什么？

[英]What is the best approach to measure a similarity between texts in multiple languages in python?

使用word2vec計算句子相似度

[英]Using word2vec to calculate sentence similarity

使用 NearestNeighbors 和 word2vec 檢測句子相似度

[英]Using NearestNeighbors and word2vec to detect sentence similarity

使用python的句子的word2vec查找2個句子之間的相似性

[英]Finding Similarity between 2 sentences using word2vec of sentence with python

從句子中獲取關鍵字相似度值的最佳方法？

[英]Best way to get keyword similarity value from a sentence?

解決Word Chain的最佳方法

[英]Best approach to solve Word Chain

如何提高python中的詞移動距離相似度並使用加權句子提供相似度得分

[英]How to improve word mover distance similarity in python and provide similarity score using weighted sentence

使用 BERT 或 LSTM 模型的大型文檔語義相似性的最佳方法

[英]Best approach for semantic similarity in large documents using BERT or LSTM models

計算文本相似度的最佳方法是什么？

[英]what is the best method to calculate text similarity?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用詞嵌入的句子相似度在 python 中測量多種語言文本之間相似性的最佳方法是什么？使用word2vec計算句子相似度使用 NearestNeighbors 和 word2vec 檢測句子相似度使用python的句子的word2vec查找2個句子之間的相似性從句子中獲取關鍵字相似度值的最佳方法？解決Word Chain的最佳方法如何提高python中的詞移動距離相似度並使用加權句子提供相似度得分使用 BERT 或 LSTM 模型的大型文檔語義相似性的最佳方法計算文本相似度的最佳方法是什么？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM