繁体   English   中英

以文本格式保存 word2vec

[英]saving word2vec in text format

我试图将 word2vec 向量保存为文本,但没有成功,我收到一个错误,我不太明白,这里出现了哪些重复项,建议的这个“wv”是什么。 也许有人可以向我解释。 先感谢您

model = Word2Vec(all_words, min_count=3, sg = 1, size = 300 )
model.save_word2vec_format('test_w2v.txt', binary=False)
WARNING:gensim.models.base_any2vec:under 10 jobs per worker: consider setting a smaller `batch_words' for smoother alpha decay
Word2Vec(vocab=20, size=300, alpha=0.025)
Traceback (most recent call last):
  File "/word2vec.py", line 26, in <module>
    model.save_word2vec_format('test_w2v.txt', binary=False)
  File "/word2vec.py", line 1307, in save_word2vec_format
    raise DeprecationWarning("Deprecated. Use model.wv.save_word2vec_format instead.")
DeprecationWarning: Deprecated. Use model.wv.save_word2vec_format instead.

因为.save_word2vec_format()只保存向量 - 而不是完整的 model - 它只能用于 model 的子属性.wv (这是一个仅包含向量的 object。)

因此,如果您按照错误消息的建议运行model.wv.save_word2vec_format('test_w2v.txt', binary=False) ,您将以文本格式保存向量。

(如果您需要保存完整的 model,请使用model.save() - 它将保存更多信息,并可能使用多个附加文件,但它将采用 Python 和 gensim 特定格式,与纯文本格式不同其他工具可以读取。)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM