簡體   English   中英

為什么要在gensim word2vec中創建多個模型文件?

[英]Why are multiple model files created in gensim word2vec?

當我嘗試創建word2vec模型(帶有負采樣的跳過圖)時,我收到了3個文件,如下所示。

word2vec (File)
word2vec.syn1nef.npy (NPY file)
word2vec.wv.syn0.npy (NPY file)

我只是擔心為什么會發生這種情況,因為我以前在word2vec中的測試示例只收到一個模型(沒有npy文件)。

請幫我。

具有較大內部向量數組的模型無法通過Python'pickle'保存到單個文件,因此,超出一定閾值后,gensim save()方法將使用更高效的原始格式將子數組存儲在單獨的文件中numpy數組( .npy格式)。

您仍然可以通過僅指定根模型文件名來load()模型。 當需要輔助數組時,加載代碼將找到輔助文件,只要它們在根文件旁邊即可。 因此,在將模型移至其他位置時,請確保將所有具有相同根文件名的文件放在一起。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM