簡體   English   中英

工人在 gensim Word2Vec 中是什么意思?

[英]what does workers means in gensim Word2Vec?

我正在嘗試使用 gensim 創建 Word2Vec 模型,但我不明白 Workers 的意思。 這是來自 radimrehurek.com 的一個例子,worker workers = 4但沒有解釋。

Word2Vec(sentences=common_texts, vector_size=100, window=5, min_count=1, workers=4)

我會非常感謝任何人可以幫助我。 Thxx

這是將在訓練階段使用的 Python 工作線程數。

如果您使用傳統的 iterable-of-texts(如sentences參數)來提供語料庫,並且您在一台至少有 4 個 CPU 內核的機器上,您通常會獲得最佳吞吐量,而workers值為至少 3 個,也許高達 8-12 個(但絕不會高於 CPU 內核數減 1)。

如果您的輸入是純文本文件,標記已經以空格分隔,並且每個以換行符分隔的文本不超過 10000 個標記,您可以使用最近引入的corpus_file選項來指定語料庫。 在這種情況下,您可能會使用與可用 CPU 內核數量相等的workers實現最大的訓練吞吐量。

(您可以通過import multiprocessing然后multiprocessing.cpu_count()獲得內核數。)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM