[英]Pandas dropna, which rows are being dropped
這是我擁有的數據框:
A B C D F E
2013-01-01 0.000000 0.000000 0.100928 5 NaN 1
2013-01-02 0.640525 0.220630 1.070226 5 1 1
2013-01-03 -0.963793 -0.476044 -0.581649 5 2 NaN
2013-01-04 0.882686 -0.371904 -1.320758 5 3 NaN
2013-01-05 0.021979 0.680987 -0.605329 5 4 NaN
2013-01-06 -0.238726 -0.487410 -0.383292 5 5 NaN
然后我運行以下代碼: df1.dropna(how='any')
,其中df1
是上述數據框。 當我之后查看df1
,這就是我得到的。
A B C D F E
2013-01-01 0.000000 0.000000 0.100928 5 NaN NaN
2013-01-02 0.640525 0.220630 1.070226 5 1 NaN
2013-01-03 -0.963793 -0.476044 -0.581649 5 2 NaN
2013-01-04 0.882686 -0.371904 -1.320758 5 3 NaN
我認為dropna
會刪除其中包含NaN
值的任何行。 因此,我期待它返回這個:
A B C D F E
2013-01-02 0.640525 0.220630 1.070226 5 1 1
為什么不是這樣?
編輯:這是代碼
這就是我的開始:
dates = pd.date_range('20130101',periods=6)
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns = list('ABCD'))
然后我這樣做:
s1 = pd.Series([1,2,3,4,5,6],index=pd.date_range('20130102',periods=6))
df['F'] = s1
df.at[dates[0],'A'] = 0
df.iat[0,1] = 0
df.loc[:,'D'] = np.array([5]*len(df))
df1 = df.reindex(index=dates[0:4], columns = list(df.columns) + ['E'])
df1.loc[dates[0]:dates[1],'E'] = 1
然后我運行dropna
dropna
返回一個新的DataFrame
。 因此,要獲得您正在尋找的結果,您必須添加
df2 = df1.dropna(how='any');
現在df2
保存所需的輸出。 如果您希望df1
有 thr 結果,請使用:
df1.dropna(how='any', inplace=True)
df1
修改了df1
。 希望這可以幫助!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.