[英]use the comparison result as the index of pandas.DataFrame
import pandas as pd
import numpy as np
df = pd.DataFrame([[1,2,3],[4,np.nan,6]])
whereNans = np.isnan(df)
print whereNans
print df[whereNans]
print "--"*30
print df>3
print df[df>3]
如上所述, whereNans
是正確的,但df[whereNans]
沒有得到我想要的。 但是, df[df>3]
可以得到我想要的。
實際上,存儲在whereNans
的索引與df>3
相同。 問題是什么?
你似乎對此感到困惑,這是正確的行為,其中掩碼是True
它將在該位置顯示結果,其中False
它將顯示NaN
,所以實際上你將顯示一個包含所有NaN
的df
因為你有一個NaN
值,它會為該位置返回NaN
,如果它為False,你就得到NaN
如果您與df>3
版本進行比較,您會發現相同的行為:
In[49]:
df[df>3]
Out[49]:
0 1 2
0 NaN NaN NaN
1 4.0 NaN 6.0
也只是為了表明這與numpy
無關,使用pandas isnull
會得到相同的結果:
In[50]:
df[df.isnull()]
Out[50]:
0 1 2
0 NaN NaN NaN
1 NaN NaN NaN
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.