簡體   English   中英

根據“不在”條件從數據框中刪除行

[英]dropping rows from dataframe based on a “not in” condition

當日期列的值在日期列表中時,我想從pandas數據幀中刪除行。 以下代碼不起作用:

a=['2015-01-01' , '2015-02-01']

df=df[df.datecolumn not in a]

我收到以下錯誤:

ValueError:Series的真值是不明確的。 使用a.empty,a.bool(),a.item(),a.any()或a.all()。

您可以使用pandas.Dataframe.isin

pandas.Dateframe.isin將返回布爾值,具體取決於每個元素是否在列表a 然后使用~將其反轉為將True轉換為False ,反之亦然。

import pandas as pd

a = ['2015-01-01' , '2015-02-01']

df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})

print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

df = df[~df['date'].isin(a)]

print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

你可以使用Series.isin

df = df[~df.datecolumn.isin(a)]

雖然錯誤消息表明可以使用all()any() ,但僅當您希望將結果減少為單個布爾值時,它們才有用。 然而,這不是你現在要做的,即測試系列中每個值與外部列表的成員資格,並保持結果完整(即布爾系列,然后將用於切片原始DataFrame) )。

您可以在Gotchas中閱讀更多相關信息。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM