簡體   English   中英

使用一個月的日期計算累積流失率 - 日期問題是主要的

[英]Cumulative Churn rate calculation using Date of a month - Date Issue is major

我需要在累積的基礎上計算每日流失率,但在嘗試使用 groupby 日期方法的多種方法之后。 我仍然無法這樣做。

我已經嘗試了多種方法來更改日期。 我試過這個來獲取日期,以便我只能使用日期的那一天,但它不起作用。

df['Day'] = df['Game_Play_Date'].apply(lambda x: x.days)

錯誤是:-即使在使用 pd.to_datetime 方法並使用 dt.days 訪問器之后,“Timestamp”對象也沒有屬性“days”。

df_ch = df.groupby('Game_Play_DayofMonth')[['pid1', 'pid2']]

這給出了數字 61882、122654 中的日期值。像這樣。

我有這樣的數據和附加列

Date        PID1    PID2
01-06-19    xa  xs
01-06-19    xb  xa
01-06-19    xc  xv
02-06-19    xd  xb
02-06-19    xe  xr
02-06-19    xf  xe

我需要這樣的結果,以便我也可以看到返回的玩家數量。

Date            ID
01-06-19    xa
01-06-19    xb
01-06-19    xc
01-06-19    xs
01-06-19    xv
02-06-19    xd
02-06-19    xe
02-06-19    xf
02-06-19    xr
02-06-19    xb

使用pd.melt

print(pd.melt(df, 'Date').iloc[:, [0, 2]].sort_values(by='Date').drop_duplicates().reset_index(drop=True))

或使用pd.DataFrame.melt

print(df.melt('Date').iloc[:, [0, 2]].sort_values(by='Date').drop_duplicates().reset_index(drop=True))

兩個輸出:

       Date value
0  01-06-19    xa
1  01-06-19    xb
2  01-06-19    xc
3  01-06-19    xs
4  01-06-19    xv
5  02-06-19    xd
6  02-06-19    xe
7  02-06-19    xf
8  02-06-19    xb
9  02-06-19    xr

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM