繁体 English 中英

如何使用TF-IDF或LSA与gensim计算单词相似度？

[英]How to compute word similarity using TF-IDF or LSA with gensim?

原文 2016-03-14 06:49:59 6 1 python/ nlp/ tf-idf/ gensim/ lsa

我知道gensim中的word2vec可以计算单词之间的相似性。 但现在我想使用TF-IDF或LSA与gensim来计算单词相似度。 怎么做？

注意：使用LSA和gensim计算文档相似性很简单： http ：//radimrehurek.com/gensim/wiki.html

TF-IDF是一种加权方案，因此it's not an alternative to LSA.

想象一下你的问题是“n”文件的“m”项矩阵。 矩阵的每个条目Aij表示文档“j”中术语“i”的权重。 这是您使用TF-IDF的地方。 知道在矩阵的每个单元格中放入什么。

然后，如果它适合您的应用程序，您可以使用LSA减小矩阵的尺寸。

我希望这可以解决一些问题。

使用Gensim进行TF-IDF计算

[英]Tf-idf calculation using gensim

[英]Updating TF-IDF using Gensim

[英]How to build a recommendation system using tf-idf and cosine similarity?

[英]how to compute TF-IDF on a specific dataset

[英]how to compute TF-IDF on dataset?

[英]Gensim - TF-IDF, how to perform a proper genesis TF-IDF?

[英]String similarity TF-IDF Bag of words or Word2vec

[英]Getting TF-IDF Scores Of Words Using Gensim

[英]Get the most important words in the corpus using tf-idf (Gensim)

[英]How to get the tf-idf values in gensim in python

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用Gensim进行TF-IDF计算使用 Gensim 更新 TF-IDF 如何使用tf-idf和余弦相似度构建推荐系统？如何在特定数据集上计算 TF-IDF 如何在数据集上计算 TF-IDF？ Gensim - TF-IDF，如何执行适当的 Genesis TF-IDF？字符串相似度TF-IDF单词或Word2vec的袋使用Gensim获取TF-IDF分数使用tf-idf（Gensim）获取语料库中最重要的词如何在python中的gensim中获取tf-idf值

相关标签