[英]what does workers means in gensim Word2Vec?
我正在嘗試使用 gensim 創建 Word2Vec 模型,但我不明白 Workers 的意思。 這是來自 radimrehurek.com 的一個例子,worker workers = 4
但沒有解釋。
Word2Vec(sentences=common_texts, vector_size=100, window=5, min_count=1, workers=4)
我會非常感謝任何人可以幫助我。 Thxx
這是將在訓練階段使用的 Python 工作線程數。
如果您使用傳統的 iterable-of-texts(如sentences
參數)來提供語料庫,並且您在一台至少有 4 個 CPU 內核的機器上,您通常會獲得最佳吞吐量,而workers
值為至少 3 個,也許高達 8-12 個(但絕不會高於 CPU 內核數減 1)。
如果您的輸入是純文本文件,標記已經以空格分隔,並且每個以換行符分隔的文本不超過 10000 個標記,您可以使用最近引入的corpus_file
選項來指定語料庫。 在這種情況下,您可能會使用與可用 CPU 內核數量相等的workers
實現最大的訓練吞吐量。
(您可以通過import multiprocessing
然后multiprocessing.cpu_count()
獲得內核數。)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.