[英]How to exclude future dates from excel data file using pandas?
我試圖將我的數據集限制在今天之前的日期。 下面創建了一個圖表,但掩碼沒有任何影響。 任何幫助表示贊賞。
df = pd.read_excel("./data/Weight.xlsx", sheet_name='Data')
date = df.iloc[:, 0]
kilos = df.iloc[:, 3]
date = pd.to_datetime(date, format='%Y-%m-%d')
mask = (date < pd.to_datetime('today'))
df = df.loc[mask]
df.head()
2021-02-06 00:00:00 18 2 115.208
42 2022-12-11 14.0 4.0 90.716
43 2022-12-18 14.0 0.0 88.900
44 2022-12-25 14.0 0.0 88.900
45 2023-01-01 14.0 2.0 89.808
46 2023-01-08 14.0 1.0 89.354
請檢查您的excel文件中是否有標題。 df
可能沒有標題。 另外,假設數字 - 41, 42, ... 都是 indeces。 這似乎可以在讀取文件時使header=None
正常工作。
更新的代碼在這里。
df = pd.read_excel("input.xlsx", sheet_name='Data', header=None)
date = df.iloc[:, 0]
kilos = df.iloc[:, 3]
date = pd.to_datetime(date, format='%Y-%m-%d')
mask = (date < pd.to_datetime('today'))
df = df.loc[mask]
輸出看起來不錯。 這就是我得到的...
>> df
0 1 2 3
0 2021-02-06 18 2 115.208
>> mask
0 True
1 False
2 False
3 False
4 False
5 False
Name: 0, dtype: bool
謝謝,這為我解決了。
克里斯
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.