[英]Python kernel dies while doing a division in Pandas
我有一個csv,大小約為94.4 MB,它包含143,940行和63列。 我只是試圖將兩列分開,然后在另一列中輸出值。 我正在執行的代碼是一個非常簡單的代碼。
DF['Col3'] = DF['Col1'] / DF['Col2']
每次我在spyder3或Jupyter Notebook上執行這段代碼時,我以前用來執行此代碼的內核都會死掉,但是我確實沒有任何問題。 現在我收到錯誤信息
內核死亡,重新啟動
我在具有8 GB RAM的筆記本電腦上運行python 2.7和anaconda版本4.3.14 pandas版本0.19.2。 其中只有1 GB在運行此代碼之前已被使用,而在我運行此代碼時將使用100%。
如果有任何建議,請指導。 謝謝
我在這里找到了解決方案: https : //www.coursera.org/learn/python-data-analysis/discussions/weeks/4/threads/VrKtIe-TEeahuQ5PjaKRFg
顯然,當涉及到NaN時,內核存在兩個系列之間的划分問題。 我按照建議用div()方法替換了“ /”運算符,從而解決了該問題。
您可以執行df.col1.div(df.col2)
,而不是執行df.col1 / df.col2
。
http://pandas.pydata.org/pandas-docs/stable/generation/pandas.DataFrame.div.html https://pandas.pydata.org/pandas-docs/stable/generation/pandas.Series.div.html
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.