簡體   English   中英

為什么用 gensim 計算相似度需要字典的大小?

[英]Why computing similarity with gensim needs the size of the dictionary?

為了使用gensim.similarities.docsim.Similarity class 來計算單詞之間的相似度,需要提供語料庫和字典的大小。

在我的例子中,語料庫是使用 word2vec model 計算的詞向量。

我想知道為什么gensim需要字典的大小? 而且,如果它在這里需要用於創建 word2vec model 的字典的大小,或語料庫的字典的大小,我想計算相似度。

請注意,您不需要使用gensim.similarities.docsim.Similarity來計算單詞到單詞的相似度。

在詞向量支持對象上有一些單獨的方法,用於計算兩個詞之間的相似度( model.similarity(wordA, wordB) )或獲取最相似的“鄰居”詞列表( model.most_similar(target_word) ) .

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM