將 Dataframe 從每月重采樣為每日

Question

這是我的問題：

這是我的 DataFrame 的樣本（實際上是從 2002 年到 2012 年）

df = pd.DataFrame(
    {'Date':["2002-07-31","2002-07-31","2002-07-31","2002-07-31","2002-07-31","2002-08-31","2002-08-31","2002-08-31","2002-08-31","2002-08-31",'2002-09-30','2002-09-30','2002-09-30','2002-09-30','2002-09-30'],
     'Name': ["Paul", "John", "Silvia", "Mike", "Cindy","Paul", "David", "Harry", "Mike", "Britney","Francis", "Michael", "Charlie", "Joe", "Hilary"]})

這給了這個

       Date     Name
0   2002-07-31  Paul
1   2002-07-31  John
2   2002-07-31  Silvia
3   2002-07-31  Mike
4   2002-07-31  Cindy
5   2002-08-31  Paul
6   2002-08-31  David
7   2002-08-31  Harry
8   2002-08-31  Mike
9   2002-08-31  Britney
10  2002-09-30  Francis
11  2002-09-30  Michael
12  2002-09-30  Charlie
13  2002-09-30  Joe
14  2002-09-30  Hilary

我想通過將所有名稱從 2002-07-31 到 2002-08-30 以及從 2002-08-31 到 2002-09-30 保持固定，將系列從每月重新采樣到每日 DataFrame（更改僅發生在每個月的月底，所以看起來像使用 ffill() 方法重新采樣）。

我正在尋找的結果是這樣的：

   Date     Name
2002-07-31  Paul
2002-07-31  John
2002-07-31  Silvia
2002-07-31  Mike
2002-07-31  Cindy
2002-08-01  Paul
2002-08-01  John
2002-08-01  Silvia
2002-08-01  Mike
2002-08-01  Cindy
2002-08-02  Paul
2002-08-02  John
2002-08-02  Silvia
2002-08-02  Mike
2002-08-02  Cindy
2002-08-03  Paul
2002-08-03  John
2002-08-03  Silvia
2002-08-03  Mike
2002-08-03  Cindy
.....

2002-08-31  Paul
2002-08-31  David
2002-08-31  Harry
2002-08-31  Mike
2002-08-31  Britney
2002-09-01  Paul
2002-09-01  David
2002-09-01  Harry
2002-09-01  Mike
2002-09-01  Britney
....

2002-09-30  Francis
2002-09-30  Michael
2002-09-30  Charlie
2002-09-30  Joe
2002-09-30  Hilary

如您所見，名稱僅在每個月底更改。 對我來說最困難的一步是我選擇了 5 個名稱，我真的不知道如何重新采樣到每天的 Dataframe 並且每天仍然有 5 個名稱。

我已經看過這個鏈接

重采樣錯誤：無法使用方法或限制重新索引非唯一索引

但這並不是一個真正的問題，我仍然沒有找到任何解決方案來管理我的問題。 如果您有任何想法，歡迎您！

Answer 1

首先，確保您的Date列是datetime時間 object：

df['Date'] = df.Date.astype('datetime64')

然后，按Date列分組，將名稱聚合到list ，按天resample並填充，最后執行explode以擴展名稱list ：

df.groupby('Date').agg(list).resample('D').ffill().explode('Name').reset_index()

# Result:
          Date     Name
0   2002-07-31     Paul
1   2002-07-31     John
2   2002-07-31   Silvia
3   2002-07-31     Mike
4   2002-07-31    Cindy
..         ...      ...
305 2002-09-30  Francis
306 2002-09-30  Michael
307 2002-09-30  Charlie
308 2002-09-30      Joe
309 2002-09-30   Hilary

[310 rows x 2 columns]

Answer 2

我將 pivot 數據並使用asfreq對數據進行采樣，然后堆棧：

(df.assign(group=df.groupby('Date').cumcount())
  .set_index(['Date','group'])['Name']
  .unstack()
  .asfreq('D').ffill()
  .unstack()
  .reset_index('group',drop=True)
  .reset_index(name='Name')
)

Output：

          Date     Name
0   2002-07-31     Paul
1   2002-07-31     John
2   2002-07-31   Silvia
3   2002-07-31     Mike
4   2002-07-31    Cindy
..         ...      ...
305 2002-09-30  Francis
306 2002-09-30  Michael
307 2002-09-30  Charlie
308 2002-09-30      Joe
309 2002-09-30   Hilary

[310 rows x 2 columns]

將 Dataframe 從每月重采樣為每日

問題描述

2 個解決方案

解決方案1
2 已采納 2020-06-01 15:56:57

解決方案2
1 2020-06-01 15:57:11

將 Dataframe 從每月重采樣為每日

問題描述

2 個解決方案

解決方案1 2 已采納 2020-06-01 15:56:57

解決方案2 1 2020-06-01 15:57:11

解決方案1
2 已采納 2020-06-01 15:56:57

解決方案2
1 2020-06-01 15:57:11