[英]How to load large dataset to gensim word2vec model
所以我有多個文本文件(大約 40 個)。 每個文件大約有 2000 篇文章(平均每篇 500 字)。 每個文檔都是文本文件中的一行。
因此,由於 memory 的限制,我想使用這些文本文件的動態加載來進行訓練。 (也許是一個迭代器 class?)
那么我該如何進行呢?
所以我有多個文本文件(大約 40 個)。 每個文件大約有 2000 篇文章(平均每篇 500 字)。 每個文檔都是文本文件中的一行。
因此,由於 memory 的限制,我想使用這些文本文件的動態加載來進行訓練。 (也許是一個迭代器 class?)
那么我該如何進行呢?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.