熊貓-切片數據並計算平均值

Question

我有一個包裹運送數據表，看起來像下面的結構：

route_id      parcel_id   loading_time           other_fields
  X1          001         14:20 25/07/2019       ...
  X2          025         14:23 25/07/2019       ...
...         ...                    ...

我想計算每個route_id每10分鍾（0-10、11-20、21-30）出現的所有包裹重量的平均值。 所以我想要的結果表如下所示：

route_id        time_window                                         average_weight(kg)
   X1           870 (i.e. 14:20 - 14:30，only show UpperBound)      550 
   X1           880                                                 1020
   ...          ...                                                 ...

如何在Pandas或SQL Server中輕松地做到這一點？

Answer 1

如果我對您的理解正確，那么您希望按route_id每隔10分鍾執行一次匯總。 另外，您的loading_time是一個字符串。 首先將其轉換為Timestamp 。

由於沒有樣本輸入數據，因此以下示例使用了一些模擬數據：

loading_times = np.random.choice(pd.date_range('2019-07-25 9:00', '2019-07-25 9:20', freq='T'), 10)
df = pd.DataFrame({
    'route_id': np.random.randint(1, 4, len(loading_times)),
    'weight': np.random.randint(1, 5, len(loading_times)),
    'loading_time': loading_times
})

樣本數據（排序）：

route_id  weight        loading_time
       1       2 2019-07-25 09:00:00
       1       1 2019-07-25 09:07:00
       1       4 2019-07-25 09:10:00
       1       1 2019-07-25 09:12:00
       1       2 2019-07-25 09:13:00
       1       2 2019-07-25 09:15:00
       1       3 2019-07-25 09:19:00
       2       4 2019-07-25 09:03:00
       3       4 2019-07-25 09:04:00
       3       3 2019-07-25 09:17:00

然后將其分組：

def summarize(x):
    return pd.Series({
        'count': len(x),
        'avg_weight': x['weight'].mean()
    })

by = ['route_id', pd.Grouper(key='loading_time', freq='10T')]
df.groupby(by).apply(summarize)

結果：

                              count  avg_weight
route_id loading_time                          
1        2019-07-25 09:00:00    2.0         1.5
         2019-07-25 09:10:00    5.0         2.4
2        2019-07-25 09:00:00    1.0         4.0
3        2019-07-25 09:00:00    1.0         4.0
         2019-07-25 09:10:00    1.0         3.0

熊貓-切片數據並計算平均值

問題描述

1 個解決方案

解決方案1
1 已采納 2019-07-25 03:07:36

熊貓-切片數據並計算平均值

問題描述

1 個解決方案

解決方案1 1 已采納 2019-07-25 03:07:36

解決方案1
1 已采納 2019-07-25 03:07:36