簡體   English   中英

如何使用不同的 datetimeindex 將 pandas dataframe 中的值填充到另一個 dataframe

[英]How to fill values from a pandas dataframe to another dataframe with different datetimeindex

我有兩個數據框。 一個有 5 分鍾的粒度 (df1),另一個按天索引 (df2)。 在本例中,日期在 7:10 結束

df1:

            Date    Close
2019-06-20 07:00:00 2927.25
2019-06-20 07:05:00 2927.00
2019-06-20 07:10:00 2926.75
2019-06-21 07:00:00 2932.25
2019-06-21 07:05:00 2932.25
2019-06-21 07:10:00 2931.00
2019-06-24 07:00:00 2941.75
2019-06-24 07:05:00 2942.25
2019-06-24 07:10:00 2941.50
2019-06-25 07:00:00 2925.50
2019-06-25 07:05:00 2926.50
2019-06-25 07:10:00 2926.50

df2:

            range                       
Date                            
2019-06-20  115.0
2019-06-21  86.0    
2019-06-24  52.0
2019-06-25  132.0   

現在我想從 df2 的“范圍”列中獲取值,並將它們重復地注入到 df1 的新列中。

它應該如下所示:

            Date    Close       range
2019-06-20 07:00:00 2927.25     115.0
2019-06-20 07:05:00 2927.00     115.0
2019-06-20 07:10:00 2926.75     115.0
2019-06-21 07:00:00 2932.25     86.0    
2019-06-21 07:05:00 2932.25     86.0    
2019-06-21 07:10:00 2931.00     86.0    
2019-06-24 07:00:00 2941.75     52.0
2019-06-24 07:05:00 2942.25     52.0
2019-06-24 07:10:00 2941.50     52.0
2019-06-25 07:00:00 2925.50     132.0
2019-06-25 07:05:00 2926.50     132.0
2019-06-25 07:10:00 2926.50     132.0

不幸的是我不知道如何開始這就是為什么沒有“我的嘗試”代碼你會怎么做?

首先將日期類列轉換為 pandas 日期時間序列:

df1['Date'] = pd.to_datetime(df1['Date'])
df2.index = pd.to_datetime(df2.index)

使用Series.dt.date + Series.map到 map range值從df2df1

df1['range'] = df1['Date'].dt.date.map(df2.set_index(df2.index.date)['range'])

或者它也可以使用DataFrame.merge

df1.assign(k=df1['Date'].dt.date).merge(df2.assign(k=df2.index.date), on='k').drop('k', 1)

結果:

                  Date    Close  range
0  2019-06-20 07:00:00  2927.25  115.0
1  2019-06-20 07:05:00  2927.00  115.0
2  2019-06-20 07:10:00  2926.75  115.0
3  2019-06-21 07:00:00  2932.25   86.0
4  2019-06-21 07:05:00  2932.25   86.0
5  2019-06-21 07:10:00  2931.00   86.0
6  2019-06-24 07:00:00  2941.75   52.0
7  2019-06-24 07:05:00  2942.25   52.0
8  2019-06-24 07:10:00  2941.50   52.0
9  2019-06-25 07:00:00  2925.50  132.0
10 2019-06-25 07:05:00  2926.50  132.0
11 2019-06-25 07:10:00  2926.50  132.0

如果你想制作一個循環,請執行以下操作:

for i in df2["Date"]:
     for j in df1["Date"]:
          if i==j:
              df1['range'] = df2['range']
  1. 需要確保您的日期列是日期
  2. 將它們設置為日粒度,因此它們在數據幀中是相同的
  3. 清理列
df1 = pd.DataFrame({"Date":["2019-06-19T23:00:00.000Z","2019-06-19T23:05:00.000Z","2019-06-19T23:10:00.000Z","2019-06-20T23:00:00.000Z","2019-06-20T23:05:00.000Z","2019-06-20T23:10:00.000Z","2019-06-23T23:00:00.000Z","2019-06-23T23:05:00.000Z","2019-06-23T23:10:00.000Z","2019-06-24T23:00:00.000Z","2019-06-24T23:05:00.000Z","2019-06-24T23:10:00.000Z"],"Close":[2927.25,2927,2926.75,2932.25,2932.25,2931,2941.75,2942.25,2941.5,2925.5,2926.5,2926.5]})
df2 = pd.DataFrame({"Date":["2019-06-19T16:00:00.000Z","2019-06-20T16:00:00.000Z","2019-06-23T16:00:00.000Z","2019-06-24T16:00:00.000Z"],"range":[115,86,52,132]})

df1.Date = pd.to_datetime(df1.Date)
df2.Date = pd.to_datetime(df2.Date)


df1.assign(day=df1.Date.dt.floor("D"))\
    .merge(df2.assign(day=df2.Date.dt.floor("D")), on="day")\
    .drop(["day","Date_y"],1).rename({"Date_x":"Date"},axis=1)

output

                     Date    Close  range
2019-06-19 23:00:00+00:00  2927.25    115
2019-06-19 23:05:00+00:00  2927.00    115
2019-06-19 23:10:00+00:00  2926.75    115
2019-06-20 23:00:00+00:00  2932.25     86
2019-06-20 23:05:00+00:00  2932.25     86
2019-06-20 23:10:00+00:00  2931.00     86
2019-06-23 23:00:00+00:00  2941.75     52
2019-06-23 23:05:00+00:00  2942.25     52
2019-06-23 23:10:00+00:00  2941.50     52
2019-06-24 23:00:00+00:00  2925.50    132
2019-06-24 23:05:00+00:00  2926.50    132
2019-06-24 23:10:00+00:00  2926.50    132

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM