如何合並兩個Word2Vec文件

Question

我使用Word2Vec創建了模型。 但是結果並不理想。 所以我想加一個詞。 我第一次創建的代碼可以創建，但不能添加。 請告訴我如何添加。

createModel.py

token = loadCsv("test_data")
embeddingmodel = []
for i in range(len(token)):
temp_embeddingmodel = []
for k in range(len(token[i][0])):
    temp_embeddingmodel.append(token[i][0][k])
embeddingmodel.append(temp_embeddingmodel)

embedding = Word2Vec(embeddingmodel, size=300, window=5, min_count=3, iter=100, sg=1,workers=4, max_vocab_size = 360000000)
embedding.save('post.embedding')

loadWord2Vec.py

tokens = W2V.tokenize(sentence)
embedding = Convert2Vec('Data/post.embedding', tokens)
zero_pad = W2V.Zero_padding(embedding, Batch_size, Maxseq_length, Vector_size)

告訴我如何添加或合並Word2Vec的結果

Answer 1

合並兩個Word2Vec模型沒有簡單的方法。

只有一起訓練的單詞向量才是“在同一空間內”，因此具有可比性。

最好的策略是將文本的兩個訓練語料庫結合起來，並在合並后的數據上訓練新的模型，從而從同一訓練中獲得所有單詞的單詞向量。

如何合並兩個Word2Vec文件

問題描述

1 個解決方案

解決方案1
2 已采納 2019-01-24 06:18:05

如何合並兩個Word2Vec文件

問題描述

1 個解決方案

解決方案1 2 已采納 2019-01-24 06:18:05

解決方案1
2 已采納 2019-01-24 06:18:05