繁体 English 中英

Word2Vec：使用 Gensim 上传预训练的 word2vec 文件时收到错误

[英]Word2Vec: Error received at uploading a pre-trained word2vec file using Gensim

原文 2019-06-25 15:11:35 2 1 python/ nlp/ gensim/ word2vec/ fasttext

尝试使用 Gensim 上传预训练的 word2vec 文件（使用 fasttext 编译）时收到错误消息。 文件具有“.vec”扩展名，可以在这里找到：http: //89.38.230.23/word_embeddings/we/corola.300.20.vec.zip

到目前为止我尝试过的：选项 1：来自 gensim.models 的 KeyedVectors 选项 2：FastText 包装器

#Option 1
    from gensim.models import KeyedVectors
    model = KeyedVectors.load_word2vec_format('Word_embeddings/corola.300.20.vec', binary=True)
######

#Option 2
    from gensim.models.wrappers import FastText
    model = FastText.load_word2vec_format('Word_embeddings/corola.300.20.vec')

错误选项 1：UnicodeDecodeError：'utf-8' 编解码器无法解码位置 0 中的字节 0x9b：起始字节无效

弃用错误选项 2：弃用警告：已弃用。 使用 gensim.models.KeyedVectors.load_word2vec_format 代替。

我需要正确的方法来使用 gensim 成功上传 word2vec 文件。

谢谢你。

1 个解决方案

有时，使用unicode_errors='ignore'参数就可以了，因为词嵌入文件中可能存在错误。 你试一试：

model = KeyedVectors.load_word2vec_format('Word_embeddings/corola.300.20.vec', binary=True, unicode_errors='ignore')

Gensim word2vec 扩充或合并预训练向量

[英]Gensim word2vec augment or merge pre-trained vectors

Gensim 的 Doc2Vec - 如何使用预训练的 word2vec（词相似性）

[英]Gensim's Doc2Vec - How to use pre-trained word2vec (word similarities)

如何加载预训练的 Word2vec 模型文件？

[英]How to load a pre-trained Word2vec MODEL File?

在 TensorFlow 中使用预训练的词嵌入（word2vec 或 Glove）

[英]Using a pre-trained word embedding (word2vec or Glove) in TensorFlow

如何加载预训练的 Word2vec MODEL 文件并重用它？

[英]How to load a pre-trained Word2vec MODEL File and reuse it?

使用LSTM预训练Word2Vec，预测句子中的下一个单词

[英]pre-trained Word2Vec with LSTM, predict next word in sentence

如何在Keras中将自己的词嵌入与像word2vec这样的预训练嵌入一起使用

[英]How to use own word embedding with pre-trained embedding like word2vec in Keras

如何从word2vec的Google预训练模型中提取单词向量？

[英]How to extract a word vector from the Google pre-trained model for word2vec?

使用 gensim 加载 word2vec 时出现内存错误

[英]memory error when using gensim for loading word2vec

Sklearn分类器无法使用Gensim Word2Vec数据进行训练

[英]Sklearn classifier can't be trained with Gensim Word2Vec data

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Gensim word2vec 扩充或合并预训练向量 Gensim 的 Doc2Vec - 如何使用预训练的 word2vec（词相似性）如何加载预训练的 Word2vec 模型文件？在 TensorFlow 中使用预训练的词嵌入（word2vec 或 Glove）如何加载预训练的 Word2vec MODEL 文件并重用它？使用LSTM预训练Word2Vec，预测句子中的下一个单词如何在Keras中将自己的词嵌入与像word2vec这样的预训练嵌入一起使用如何从word2vec的Google预训练模型中提取单词向量？使用 gensim 加载 word2vec 时出现内存错误 Sklearn分类器无法使用Gensim Word2Vec数据进行训练

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM