繁体 English 中英

如何将大型数据集加载到 gensim word2vec model

[英]How to load large dataset to gensim word2vec model

原文 2020-08-17 22:55:40 0 1 python/ iterator/ gensim/ word2vec

所以我有多个文本文件（大约 40 个）。 每个文件大约有 2000 篇文章（平均每篇 500 字）。 每个文档都是文本文件中的一行。

因此，由于 memory 的限制，我想使用这些文本文件的动态加载来进行训练。 （也许是一个迭代器 class？）

那么我该如何进行呢？

训练每个文本文件 -> 保存 model -> 加载 model 并重新运行新数据？
迭代器 class 有没有办法自动执行此操作？
我应该逐句、逐条或逐个文本文件地给出 model 培训的输入吗？

1 个解决方案

所以我有多个文本文件（大约 40 个）。 每个文件大约有 2000 篇文章（平均每篇 500 字）。 每个文档都是文本文件中的一行。

因此，由于 memory 的限制，我想使用这些文本文件的动态加载来进行训练。 （也许是一个迭代器 class？）

那么我该如何进行呢？

训练每个文本文件 -> 保存 model -> 加载 model 并重新运行新数据？
迭代器 class 有没有办法自动执行此操作？
我应该逐句、逐条或逐个文本文件地给出 model 培训的输入吗？

无法加载已保存的gensim word2vec模型

[英]Can't load saved gensim word2vec model

如何从gensim中的Word2Vec模型中完全删除单词？

[英]How to remove a word completely from a Word2Vec model in gensim?

Gensim word2vec 和大量文本

[英]Gensim word2vec and large amount of texts

如何更快地将 Word2Vec 预训练的 model 加载到 Gensim 中？

[英]How can a Word2Vec pretrained model be loaded in Gensim faster?

如何在 gensim 中的 word2vec model 中嵌入用户名

[英]How to embed user names in word2vec model in gensim

如何使用gensim在Wikipedia页面上训练Word2Vec模型？

[英]How to train Word2Vec model on Wikipedia page using gensim?

Gensim 无法加载 word2vec 模型

[英]Gensim unable to load word2vec models

gensim中的增量Word2Vec模型训练

[英]Incremental Word2Vec Model Training in gensim

Gensim Word2Vec model 浮点数

[英]Gensim Word2Vec model floating point

Gensim Word2Vec 模型：切割尺寸

[英]Gensim Word2Vec model: Cut dimensions

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 无法加载已保存的gensim word2vec模型如何从gensim中的Word2Vec模型中完全删除单词？ Gensim word2vec 和大量文本如何更快地将 Word2Vec 预训练的 model 加载到 Gensim 中？如何在 gensim 中的 word2vec model 中嵌入用户名如何使用gensim在Wikipedia页面上训练Word2Vec模型？ Gensim 无法加载 word2vec 模型 gensim中的增量Word2Vec模型训练 Gensim Word2Vec model 浮点数 Gensim Word2Vec 模型：切割尺寸

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM