簡體   English   中英

在Tensorflow中訓練wordvec,導入Gensim

[英]Training wordvec in Tensorflow, importing to Gensim

我正在從tensorflow教程中訓練word2vec模型。

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/word2vec/word2vec_basic.py

訓練結束后,我得到了嵌入矩陣。 我想保存它並將其作為gensim中訓練有素的模型導入。

要在gensim中加載模型,命令為:

model = Word2Vec.load_word2vec_format(fn, binary=True)

但是如何從Tensorflow生成fn文件?

謝謝

一種方法是將文件保存為非二進制Word2Vec格式,基本上如下所示:

num_words vector_size  # this is the header
label0 x00 x01 ... x0N
label1 x10 x11 ... x1N
...

例:

2 3
word0 -0.000737 -0.002106 0.001851
word1 -0.000878 -0.002106 0.002834

保存文件,然后使用kwarg binary=False加載:

model = Word2Vec.load_word2vec_format(filename, binary=False)

print(model['word0'])

更新

加載模型的新方法是:

from gensim.models.keyedvectors import KeyedVectors

model = KeyedVectors.load_word2vec_format(model_path, binary=False)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM