[英]Why computing similarity with gensim needs the size of the dictionary?
為了使用gensim.similarities.docsim.Similarity
class 來計算單詞之間的相似度,需要提供語料庫和字典的大小。
在我的例子中,語料庫是使用 word2vec model 計算的詞向量。
我想知道為什么gensim
需要字典的大小? 而且,如果它在這里需要用於創建 word2vec model 的字典的大小,或語料庫的字典的大小,我想計算相似度。
請注意,您不需要使用gensim.similarities.docsim.Similarity
來計算單詞到單詞的相似度。
在詞向量支持對象上有一些單獨的方法,用於計算兩個詞之間的相似度( model.similarity(wordA, wordB)
)或獲取最相似的“鄰居”詞列表( model.most_similar(target_word)
) .
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.