使用比較結果作為pandas.DataFrame的索引

Question

import pandas as pd
import numpy as np

df = pd.DataFrame([[1,2,3],[4,np.nan,6]])
whereNans = np.isnan(df)
print whereNans
print df[whereNans]

print "--"*30

print df>3
print df[df>3]

如上所述， whereNans是正確的，但df[whereNans]沒有得到我想要的。 但是， df[df>3]可以得到我想要的。

實際上，存儲在whereNans的索引與df>3相同。 問題是什么？

Answer 1

你似乎對此感到困惑，這是正確的行為，其中掩碼是True它將在該位置顯示結果，其中False它將顯示NaN ，所以實際上你將顯示一個包含所有NaN的df

因為你有一個NaN值，它會為該位置返回NaN ，如果它為False，你就得到NaN

如果您與df>3版本進行比較，您會發現相同的行為：

In[49]:
df[df>3]

Out[49]: 
     0   1    2
0  NaN NaN  NaN
1  4.0 NaN  6.0

也只是為了表明這與numpy無關，使用pandas isnull會得到相同的結果：

In[50]:
df[df.isnull()]

Out[50]: 
    0   1   2
0 NaN NaN NaN
1 NaN NaN NaN

使用比較結果作為pandas.DataFrame的索引

問題描述

1 個解決方案

解決方案1
3 已采納 2017-05-16 10:13:38

使用比較結果作為pandas.DataFrame的索引

問題描述

1 個解決方案

解決方案1 3 已采納 2017-05-16 10:13:38

解決方案1
3 已采納 2017-05-16 10:13:38