簡體 English 中英

使用多線程時內核死亡

[英]Kernel dies when using multithreading

原文 2018-05-23 10:28:27 2 1 python/ multithreading/ jupyter-notebook

我正在使用jupyter筆記本來計算多個csv文件中一個值的出現。 我大約有60個csv文件，每個文件約1GB。 為了有效地遍歷它們，我使用了多線程。 但是，只要執行以下代碼，內核就會死掉：

from multiprocessing.dummy import Pool as ThreadPool 
files = glob.glob(path + '/*.csv')
def func(f):
    df = pd.read_csv(f)
    df = df[df['key'] == 1]
    return df['key'].value_counts()



pool = ThreadPool(4) 
results = pool.map(func, files)

pool.close() 
pool.join() 

results

這可能是什么原因？ 有沒有辦法解決這個問題？

1 個解決方案

您的代碼中有兩個問題。

對於Python，實際上是通過multiprocessing.dummy中的Pool使用多線程而不是多處理。 如果要使用多重處理，請更改為以下內容：
```
 from multiprocessing import Pool 
```
但是，正如您提到的，大約有60G數據，我擔心您的本地計算機無法處理嗎？

我相信您需要一個功能強大的集群來完成此任務（不再需要熊貓）。 因此您可能需要考慮使用Spark之類的東西。

 df = spark.read.csv(your_file_list, header=True) df = df.filter(df.Key == 1) df.head(5) # you can use df.collect() if the resultset if not too large

使用scikit時SGDClassifier內核消失

[英]SGDClassifier kernel dies when using scikit

使用 numba 重載時 Python 內核死掉

[英]Python kernel dies when using numba overload

Spyder - 使用 sys.exit() 時 kernel 死機

[英]Spyder - kernel dies when using sys.exit()

當使用pandas處理來自sql的數據幀時，內核會死掉

[英]Kernel dies when using pandas to work on dataframe from sql

運行GridSearchCV時內核死掉

[英]Kernel dies when running GridSearchCV

每當使用 pandas 時，Kernel 都會死掉

[英]Kernel dies whenever using pandas

Jupyter 內核在我使用 .apply 時死亡

[英]Jupyter Kernel Dies when I use .apply

嘗試擬合 CNN 模型時內核死機

[英]Kernel dies when trying to fit the CNN Model

導入Tensorflow時Jupyter Notebook Kernel死亡

[英]Jupyter Notebook Kernel dies when importing Tensorflow

導入tensorflow 1.7時Python內核死亡

[英]Python kernel dies when importing tensorflow 1.7

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用scikit時SGDClassifier內核消失使用 numba 重載時 Python 內核死掉 Spyder - 使用 sys.exit() 時 kernel 死機當使用pandas處理來自sql的數據幀時，內核會死掉運行GridSearchCV時內核死掉每當使用 pandas 時，Kernel 都會死掉 Jupyter 內核在我使用 .apply 時死亡嘗試擬合 CNN 模型時內核死機導入Tensorflow時Jupyter Notebook Kernel死亡導入tensorflow 1.7時Python內核死亡

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM