[英]Cumulative Churn rate calculation using Date of a month - Date Issue is major
我需要在累積的基礎上計算每日流失率,但在嘗試使用 groupby 日期方法的多種方法之后。 我仍然無法這樣做。
我已經嘗試了多種方法來更改日期。 我試過這個來獲取日期,以便我只能使用日期的那一天,但它不起作用。
df['Day'] = df['Game_Play_Date'].apply(lambda x: x.days)
錯誤是:-即使在使用 pd.to_datetime 方法並使用 dt.days 訪問器之后,“Timestamp”對象也沒有屬性“days”。
df_ch = df.groupby('Game_Play_DayofMonth')[['pid1', 'pid2']]
這給出了數字 61882、122654 中的日期值。像這樣。
我有這樣的數據和附加列
Date PID1 PID2
01-06-19 xa xs
01-06-19 xb xa
01-06-19 xc xv
02-06-19 xd xb
02-06-19 xe xr
02-06-19 xf xe
我需要這樣的結果,以便我也可以看到返回的玩家數量。
Date ID
01-06-19 xa
01-06-19 xb
01-06-19 xc
01-06-19 xs
01-06-19 xv
02-06-19 xd
02-06-19 xe
02-06-19 xf
02-06-19 xr
02-06-19 xb
使用pd.melt
:
print(pd.melt(df, 'Date').iloc[:, [0, 2]].sort_values(by='Date').drop_duplicates().reset_index(drop=True))
或使用pd.DataFrame.melt
:
print(df.melt('Date').iloc[:, [0, 2]].sort_values(by='Date').drop_duplicates().reset_index(drop=True))
兩個輸出:
Date value
0 01-06-19 xa
1 01-06-19 xb
2 01-06-19 xc
3 01-06-19 xs
4 01-06-19 xv
5 02-06-19 xd
6 02-06-19 xe
7 02-06-19 xf
8 02-06-19 xb
9 02-06-19 xr
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.