[英]checking if it is a holiday based on date using holidays library -python
我有一個過去 3 年的數據集,我想根據假期添加一個新列。 當我嘗試這個時:
import holidays
de_holidays = holidays.DE()
for date, name in sorted(holidays.DE(years=2021).items()):
print(date, name)
我得到了結果
2021-01-01 Neujahr
2021-04-02 Karfreitag
2021-04-05 Ostermontag
2021-05-01 Erster Mai
2021-05-13 Christi Himmelfahrt
2021-05-24 Pfingstmontag
2021-10-03 Tag der Deutschen Einheit
2021-12-25 Erster Weihnachtstag
2021-12-26 Zweiter Weihnachtstag
現在我想在我現有的數據集中用真/假創建一個新列,以防萬一。 我嘗試使用下面的代碼片段。
My Date column looks something like this: Dtype is datetime64[ns]
2021-07-22
2021-07-21
2021-07-20
2021-07-19
#I used the code
import holidays
de_holidays = holidays.DE()
df['Holiday'] = df['Date'].isin(de_holidays)
rslt_df
rslt_df.loc[rslt_df['Date'] == '2021-05-13']
我期望的結果是 True,因為 5 月 13 日是假期,但我意識到這段代碼給出了所有錯誤值。 有人可以幫忙嗎?
編輯
12390 2021-07-22
12380 2021-07-21
12370 2021-07-20
12360 2021-07-19
12350 2021-07-18
...
40 2018-03-05
30 2018-03-04
20 2018-03-03
10 2018-03-02
0 2018-03-01
Name: Date, Length: 1240, dtype: datetime64[ns]
現在當我使用
df['Holiday'] = df['Date'].isin(holidays.DE(years=2021))
我得到了正確的真/假值,但是一旦我刪除了年份選項卡,我就會得到所有的假值
df['Holiday'] = df['Date'].isin(holidays.DE())
這很適合獲取布爾值
from datetime import date
import holidays
de_holidays = holidays.DE()
#date(2021-07-22) in de_holidays
rslt_df['Holiday'] = rslt_df['Date'].isin(holidays.DE(years=[2018,2019,2020,2021]))
rslt_df
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.