簡體   English   中英

如何使用熊貓從excel數據文件中排除未來日期?

[英]How to exclude future dates from excel data file using pandas?

我試圖將我的數據集限制在今天之前的日期。 下面創建了一個圖表,但掩碼沒有任何影響。 任何幫助表示贊賞。

df = pd.read_excel("./data/Weight.xlsx", sheet_name='Data')
    
date = df.iloc[:, 0]
kilos = df.iloc[:, 3]

date = pd.to_datetime(date, format='%Y-%m-%d')
 
mask = (date < pd.to_datetime('today'))
df = df.loc[mask]
df.head()

   2021-02-06 00:00:00    18    2  115.208
42          2022-12-11  14.0  4.0   90.716
43          2022-12-18  14.0  0.0   88.900
44          2022-12-25  14.0  0.0   88.900
45          2023-01-01  14.0  2.0   89.808
46          2023-01-08  14.0  1.0   89.354

請檢查您的excel文件中是否有標題。 df可能沒有標題。 另外,假設數字 - 41, 42, ... 都是 indeces。 這似乎可以在讀取文件時使header=None正常工作。

輸入excel在這里輸入

更新的代碼在這里。

df = pd.read_excel("input.xlsx", sheet_name='Data', header=None)
    
date = df.iloc[:, 0]
kilos = df.iloc[:, 3]

date = pd.to_datetime(date, format='%Y-%m-%d')
 
mask = (date < pd.to_datetime('today'))
df = df.loc[mask]

輸出看起來不錯。 這就是我得到的...

>> df
    0   1   2   3
0   2021-02-06  18  2   115.208

>> mask
0     True
1    False
2    False
3    False
4    False
5    False
Name: 0, dtype: bool

謝謝,這為我解決了。

克里斯

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM