簡體   English   中英

如何合並兩個Word2Vec文件

[英]how to merge two Word2Vec File

我使用Word2Vec創建了模型。 但是結果並不理想。 所以我想加一個詞。 我第一次創建的代碼可以創建,但不能添加。 請告訴我如何添加。

createModel.py

token = loadCsv("test_data")
embeddingmodel = []
for i in range(len(token)):
temp_embeddingmodel = []
for k in range(len(token[i][0])):
    temp_embeddingmodel.append(token[i][0][k])
embeddingmodel.append(temp_embeddingmodel)

embedding = Word2Vec(embeddingmodel, size=300, window=5, min_count=3, iter=100, sg=1,workers=4, max_vocab_size = 360000000)
embedding.save('post.embedding')

loadWord2Vec.py

tokens = W2V.tokenize(sentence)
embedding = Convert2Vec('Data/post.embedding', tokens)
zero_pad = W2V.Zero_padding(embedding, Batch_size, Maxseq_length, Vector_size)

告訴我如何添加或合並Word2Vec的結果

合並兩個Word2Vec模型沒有簡單的方法。

只有一起訓練的單詞向量才是“在同一空間內”,因此具有可比性。

最好的策略是將文本的兩個訓練語料庫結合起來,並在合並后的數據上訓練新的模型,從而從同一訓練中獲得所有單詞的單詞向量。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM