簡體 English 中英

Word2Vec：使用 Gensim 上傳預訓練的 word2vec 文件時收到錯誤

[英]Word2Vec: Error received at uploading a pre-trained word2vec file using Gensim

原文 2019-06-25 15:11:35 9 1 python/ nlp/ gensim/ word2vec/ fasttext

嘗試使用 Gensim 上傳預訓練的 word2vec 文件（使用 fasttext 編譯）時收到錯誤消息。 文件具有“.vec”擴展名，可以在這里找到：http: //89.38.230.23/word_embeddings/we/corola.300.20.vec.zip

到目前為止我嘗試過的：選項 1：來自 gensim.models 的 KeyedVectors 選項 2：FastText 包裝器

#Option 1
    from gensim.models import KeyedVectors
    model = KeyedVectors.load_word2vec_format('Word_embeddings/corola.300.20.vec', binary=True)
######

#Option 2
    from gensim.models.wrappers import FastText
    model = FastText.load_word2vec_format('Word_embeddings/corola.300.20.vec')

錯誤選項 1：UnicodeDecodeError：'utf-8' 編解碼器無法解碼位置 0 中的字節 0x9b：起始字節無效

棄用錯誤選項 2：棄用警告：已棄用。 使用 gensim.models.KeyedVectors.load_word2vec_format 代替。

我需要正確的方法來使用 gensim 成功上傳 word2vec 文件。

謝謝你。

1 個解決方案

有時，使用unicode_errors='ignore'參數就可以了，因為詞嵌入文件中可能存在錯誤。 你試一試：

model = KeyedVectors.load_word2vec_format('Word_embeddings/corola.300.20.vec', binary=True, unicode_errors='ignore')

Gensim word2vec 擴充或合並預訓練向量

[英]Gensim word2vec augment or merge pre-trained vectors

Gensim 的 Doc2Vec - 如何使用預訓練的 word2vec（詞相似性）

[英]Gensim's Doc2Vec - How to use pre-trained word2vec (word similarities)

如何加載預訓練的 Word2vec 模型文件？

[英]How to load a pre-trained Word2vec MODEL File?

在 TensorFlow 中使用預訓練的詞嵌入（word2vec 或 Glove）

[英]Using a pre-trained word embedding (word2vec or Glove) in TensorFlow

如何加載預訓練的 Word2vec MODEL 文件並重用它？

[英]How to load a pre-trained Word2vec MODEL File and reuse it?

使用LSTM預訓練Word2Vec，預測句子中的下一個單詞

[英]pre-trained Word2Vec with LSTM, predict next word in sentence

如何在Keras中將自己的詞嵌入與像word2vec這樣的預訓練嵌入一起使用

[英]How to use own word embedding with pre-trained embedding like word2vec in Keras

如何從word2vec的Google預訓練模型中提取單詞向量？

[英]How to extract a word vector from the Google pre-trained model for word2vec?

使用 gensim 加載 word2vec 時出現內存錯誤

[英]memory error when using gensim for loading word2vec

Sklearn分類器無法使用Gensim Word2Vec數據進行訓練

[英]Sklearn classifier can't be trained with Gensim Word2Vec data

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Gensim word2vec 擴充或合並預訓練向量 Gensim 的 Doc2Vec - 如何使用預訓練的 word2vec（詞相似性）如何加載預訓練的 Word2vec 模型文件？在 TensorFlow 中使用預訓練的詞嵌入（word2vec 或 Glove）如何加載預訓練的 Word2vec MODEL 文件並重用它？使用LSTM預訓練Word2Vec，預測句子中的下一個單詞如何在Keras中將自己的詞嵌入與像word2vec這樣的預訓練嵌入一起使用如何從word2vec的Google預訓練模型中提取單詞向量？使用 gensim 加載 word2vec 時出現內存錯誤 Sklearn分類器無法使用Gensim Word2Vec數據進行訓練

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM