簡體   English   中英

了解手套向量的用法

[英]Understanding usage of glove vectors

我使用以下代碼使用手套向量進行詞嵌入

from gensim.scripts.glove2word2vec import glove2word2vec    #line1
glove_input_file = 'glove.840B.300d.txt'  #line2
word2vec_output_file = 'glove.word2vec'   #line3
glove2word2vec(glove_input_file, word2vec_output_file)  #line4
from gensim.models import KeyedVectors  #line5
glove_w2vec = KeyedVectors.load_word2vec_format('glove.word2vec', binary=False) #line6

我知道這段代碼是用於將手套預訓練向量用於您的詞嵌入。 但我不確定每一行發生了什么。 為什么要將手套轉換為 word2vec 格式? KeyedVectors.load_word2vec_format 究竟做了什么?

GloVe 算法和word2vec都創建詞向量,每個詞一個向量。

但是存儲這些向量的格式略有不同。 gensim glove2word2vec()函數可讓您將 GloVe 格式的文件轉換為原始 Google word2vec.c代碼使用的格式。

https://radimrehurek.com/gensim/scripts/glove2word2vec.html

同時, gensim KeyedVectors.load_word2vec_format()方法可以將word2vec.c格式的向量加載到KeyedVectors的實例(或其相同接口子類之一)中,以便於查找和其他常見的詞向量操作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM