如何将 pd.Series 添加到多索引 DataFrame 的子集？

Question

我有一个多索引 dataframe 创建者：

arrays = [['task_1','task_2', 'task_2'],['accuracy', 'accuracy', 'precision']]
mux = pd.MultiIndex.from_arrays(arrays, names=('task', 'metric'))
data = [[4., 5., 6.], [1., 1., 1.]]
res = pd.DataFrame(data, columns=mux, index=['total', 'counts']).transpose()

>>> res                  
                   total  counts
task   metric                  
task_1 accuracy     4.0     1.0
task_2 accuracy     5.0     1.0
       precision    6.0     1.0

现在我想通过将[0.1, 0.2]分别添加到task_2.accuracy和task_2.precision来更新task_2的total列：

update = pd.Series([0.1, 0.2], index=['accuracy', 'precision'])
res.total.task_2 += update

>>> res
                  total  counts
task   metric                  
task_1 accuracy     4.0     1.0
task_2 accuracy     NaN     1.0
       precision    NaN     1.0

为什么我得到NaN ？ 从另一个问题中学习，我还尝试了两种方法来尝试匹配update和res.total.task_2之间的索引。 但是，它们都不适用于我的情况。

res.total.task_2 += update.values
# -OR-
res.total.task_2 += update.reset_index(drop=True, inplace=True)

Answer 1

我们有一个添加级别的选项，我们可以将其与series.xs一起使用以仅在所需的第 0 级别添加，然后重新索引并添加：

res['total'] = (res['total'].xs("task_2",drop_level=False)
                .add(update,level=1).reindex(res.index)
                .fillna(res['total']))
print(res)

                  total  counts
task   metric                  
task_1 accuracy     4.0     1.0
task_2 accuracy     5.1     1.0
       precision    6.2     1.0

Answer 2

似乎您需要通过更新所有行来更改res.total.task_2值

res.total.task_2.iloc[:] = res.total.task_2 + update

或使用pandas.Series.update()

res.total.task_2.update(res.total.task_2 + update)

或一一增值

for i in range(len(update)):
    res.total.task_2.iloc[i] += update.iloc[i]

# print(res)

                  total  counts
task   metric                  
task_1 accuracy     4.0     1.0
task_2 accuracy     5.1     1.0
       precision    6.2     1.0

如何将 pd.Series 添加到多索引 DataFrame 的子集？

问题描述

2 个解决方案

解决方案1
1 2021-04-13 15:14:36

解决方案2
1 2021-04-13 15:45:24

如何将 pd.Series 添加到多索引 DataFrame 的子集？

问题描述

2 个解决方案

解决方案1 1 2021-04-13 15:14:36

解决方案2 1 2021-04-13 15:45:24

解决方案1
1 2021-04-13 15:14:36

解决方案2
1 2021-04-13 15:45:24