Pandas：使用iterrows（）和pd.Series將值附加到系列

Question

我的輸入數據如下所示：

   cat  start               target
0   1   2016-09-01 00:00:00 4.370279
1   1   2016-09-01 00:00:00 1.367778
2   1   2016-09-01 00:00:00 0.385834

我想構建一個系列，使用“開始”作為開始日期，使用“目標”作為系列值。 iterrows（）正在為“imp”提取正確的值，但是當附加到time_series時，只有第一個值被傳遞到所有系列點。 “data = imp”每次拉第0行的原因是什么？

t0 = model_input_test['start'][0] # t0 = 2016-09-01 00:00:00
num_ts = len(model_input_test.index) # num_ts = 1348
time_series = []
for i, row in model_input_test.iterrows():
    imp = row.loc['target']
    print(imp)
    index = pd.DatetimeIndex(start=t0, freq='H', periods=num_ts)
    time_series.append(pd.Series(data=imp, index=index))

可以在此處看到屏幕截圖。

系列“time_series”應如下所示：

2016-09-01 00:00:00    4.370279
2016-09-01 01:00:00    1.367778
2016-09-01 02:00:00    0.385834

但最終看起來像這樣：

2016-09-01 00:00:00    4.370279
2016-09-01 01:00:00    4.370279
2016-09-01 02:00:00    4.370279

我在Sagemaker上使用Jupyter conda_python3。

Answer 1

使用數據幀時，通常有更好的方法來執行任務，然后遍歷數據幀。 例如，在您的情況下，您可以像這樣創建系列：

time_series = (df.set_index(pd.date_range(pd.to_datetime(df.start).iloc[0],
                                        periods = len(df), freq='H')))['target']


>>> time_series
2016-09-01 00:00:00    4.370279
2016-09-01 01:00:00    1.367778
2016-09-01 02:00:00    0.385834
Freq: H, Name: target, dtype: float64
>>> type(time_series)
<class 'pandas.core.series.Series'>

基本上，這表示：“將索引設置為從第一個日期開始每小時遞增一個日期范圍，然后獲取target列”

Answer 2

給定數據幀df和系列start和target ，您只需使用set_index ：

time_series = df.set_index('start')['target']

Pandas：使用iterrows（）和pd.Series將值附加到系列

問題描述

2 個解決方案

解決方案1
1 已采納 2018-07-23 17:33:18

解決方案2
0 2018-07-23 17:37:01

Pandas：使用iterrows（）和pd.Series將值附加到系列

問題描述

2 個解決方案

解決方案1 1 已采納 2018-07-23 17:33:18

解決方案2 0 2018-07-23 17:37:01

解決方案1
1 已采納 2018-07-23 17:33:18

解決方案2
0 2018-07-23 17:37:01