繁体 English 中英

词/句相似度。最好的方法是什么？

[英]Word/Sentence similarity. What is the best approach?

原文 2019-07-31 03:16:24 8 1 python/ nlp

我需要为产品主数据目的构建一个算法，但我不确定最好的 NLP 方法。 场景是： - 我有产品黄金记录； - 我还有很多其他的产品目录需要统一； 示例： - 产品黄金记录：可乐和可乐零； - 需要协调的产品描述：可乐300ml、可乐零300ml、可乐零。

我需要一个通过相似性进行协调的算法，因为我必须考虑拼写错误，有时还要考虑句子中的某个产品。 例子：可乐零JS MKT（JS和MKT都是垃圾，但句子更像可乐零）。

我一直在测试一些 NLP 的句子相似性，例如 Bag of words 以及阅读其他一些方法，例如 Cosine Similarity 和 Levenshtein distance。 但是，我不知道什么是我的情况的最佳选择。

您能否帮助我了解实现我所需要的最佳方法？

1 个解决方案

通过使用余弦相似度和 Levenshtein 距离，我找到了两个很好的解决方案。 我的情况是，余弦相似度效果更好，因为我很容易在文本中找到品牌名称的一部分，因此获得了 100% 的准确率。 矩阵替换 (Levenshtein) 也不错，但由于数据集中的单词非常相似，我纠正了一些错误。

使用词嵌入的句子相似度

[英]sentence similarity using word embedding

在 python 中测量多种语言文本之间相似性的最佳方法是什么？

[英]What is the best approach to measure a similarity between texts in multiple languages in python?

使用word2vec计算句子相似度

[英]Using word2vec to calculate sentence similarity

使用 NearestNeighbors 和 word2vec 检测句子相似度

[英]Using NearestNeighbors and word2vec to detect sentence similarity

使用python的句子的word2vec查找2个句子之间的相似性

[英]Finding Similarity between 2 sentences using word2vec of sentence with python

从句子中获取关键字相似度值的最佳方法？

[英]Best way to get keyword similarity value from a sentence?

解决Word Chain的最佳方法

[英]Best approach to solve Word Chain

如何提高python中的词移动距离相似度并使用加权句子提供相似度得分

[英]How to improve word mover distance similarity in python and provide similarity score using weighted sentence

使用 BERT 或 LSTM 模型的大型文档语义相似性的最佳方法

[英]Best approach for semantic similarity in large documents using BERT or LSTM models

计算文本相似度的最佳方法是什么？

[英]what is the best method to calculate text similarity?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用词嵌入的句子相似度在 python 中测量多种语言文本之间相似性的最佳方法是什么？使用word2vec计算句子相似度使用 NearestNeighbors 和 word2vec 检测句子相似度使用python的句子的word2vec查找2个句子之间的相似性从句子中获取关键字相似度值的最佳方法？解决Word Chain的最佳方法如何提高python中的词移动距离相似度并使用加权句子提供相似度得分使用 BERT 或 LSTM 模型的大型文档语义相似性的最佳方法计算文本相似度的最佳方法是什么？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM