簡體 English 中英

為什么用 gensim 計算相似度需要字典的大小？

[英]Why computing similarity with gensim needs the size of the dictionary?

原文 2020-06-23 07:55:10 8 1 python/ nlp/ gensim

為了使用gensim.similarities.docsim.Similarity class 來計算單詞之間的相似度，需要提供語料庫和字典的大小。

在我的例子中，語料庫是使用 word2vec model 計算的詞向量。

我想知道為什么gensim需要字典的大小？ 而且，如果它在這里需要用於創建 word2vec model 的字典的大小，或語料庫的字典的大小，我想計算相似度。

請注意，您不需要使用gensim.similarities.docsim.Similarity來計算單詞到單詞的相似度。

在詞向量支持對象上有一些單獨的方法，用於計算兩個詞之間的相似度（ model.similarity(wordA, wordB) ）或獲取最相似的“鄰居”詞列表（ model.most_similar(target_word) ） .

[英]Gensim word2vec WMD similarity dictionary

[英]How to reduce dictionary size in gensim?

[英]A proper way to create dictionary from df or the way for computing jaccard similarity

[英]gensim: custom similarity measure

[英]Gensim pretrained model similarity

[英]Page similarity calculation with Gensim

[英]Document Similarity Gensim

[英]Gensim needs a C compiler?

[英]How to increase Dictionary size in gensim while making Corpus?

[英]Computing Jaccard Similarity in Python

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Gensim word2vec WMD相似詞典如何減少gensim中的字典大小？從df創建字典的正確方法或計算jaccard相似度的方法 gensim：自定義相似度量 Gensim預訓練模型相似度使用 Gensim 計算頁面相似度文件相似性Gensim Gensim 需要 C 編譯器嗎？制作語料庫時如何增加gensim中的Dictionary大小？在Python中計算Jaccard相似度

相關標簽