将不同的数据框合并在一起，但索引可能并不总是相同

Question

我有 11 个不同的区域（P01、P02、...、P11），每个区域都有一些由代码标识的设备（INV 1-1、INV 1-2、...、INV 8-4）。 问题是设备数量因地区而异，例如，P01 没有代码 INV 6-4，但 P02 有。 但它们的值将始终位于index数组上。

我有一个名为allEquipAllAreas的 dataframe ，它为每个区域的每个 INV 保存浮点值。 这是一个例子：

P01-INV-1-1 P01-INV-1-2 P01-INV-1-3 P01-INV-1-4 P11-INV-7-2 P11-INV-7-3 P11-INV-7-4
   -0.52       1.89         1.61        1.59        2.02        1.29       -0.89

我通过所有区域为 go 创建了一个 for 并获取与该区域相关的所有设备，所以我想最终得到一个最终的 dataframe （ heatMapInvdf ），如下所示，而不是“NaN”，我想分别将allEquipAllAreas放在列：

         P01  P02  P03  P04  P05  P06  P07  P08  P09  P10  P11
INV 1-1  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
INV 1-2  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
INV 1-3  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
  ...                             ...
INV 8-2  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
INV 8-3  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
INV 8-4  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN

我试图合并它们但无法实现我想要的，所以我到目前为止所做的是：

index = ['INV 1-1','INV 1-2','INV 1-3','INV 1-4','INV 2-1','INV 2-2','INV 2-3','INV 2-4',
 'INV 3-1','INV 3-2','INV 3-3','INV 3-4','INV 4-1','INV 4-2','INV 4-3','INV 4-4',
 'INV 5-1','INV 5-2','INV 5-3','INV 5-4','INV 6-1','INV 6-2','INV 6-3','INV 6-4',
 'INV 7-1','INV 7-2','INV 7-3','INV 7-4','INV 8-1','INV 8-2','INV 8-3','INV 8-4']
columns = ['P01','P02','P03','P04','P05','P06','P07','P08','P09','P10','P11']
heatMapInvdf = pd.DataFrame(index=index, columns=columns)
for area in areas:
    equipInArea = allEquipAllAreas.loc[:,allEquipAllAreas.columns.str.contains('P'+area+'-')]
    equipInArea = equipInArea.reindex(sorted(equipInArea.columns), axis=1).T
    equipInArea.index = equipInArea.index.str.replace(r'P'+area+'-', '')
    heatMapInvdf.merge(equipInArea,how='inner',right_index=True,left_index=True)

非常感谢任何帮助！

Answer 1

您在源 DF 中拥有所需的一切。 系统地重塑它

转置
具有拆分原始列名的多索引的索引
unstack()得到你想要的结构
droplevel()清理

import io
import numpy as np
df = pd.read_csv(io.StringIO("""P01-INV-1-1 P01-INV-1-2 P01-INV-1-3 P01-INV-1-4 P11-INV-7-2 P11-INV-7-3 P11-INV-7-4
   -0.52       1.89         1.61        1.59        2.02        1.29       -0.89"""), sep="\s+")

heatMapInvdf = (
    # transpose for primary shape that is wanted
    df.T
    # index by multi-index which are from columns
    .set_index(pd.MultiIndex.from_arrays(np.array([c.split("-", 1) for c in df.columns]).T))
    # unstack the P0n part of index
    .unstack(0)
    # remove transitent level from column index
    .droplevel(0, axis=1)

)

	P01	P11
INV-1-1	-0.52	楠
INV-1-2	1.89	楠
INV-1-3	1.61	楠
INV-1-4	1.59	楠
INV-7-2	楠	2.02
INV-7-3	楠	1.29
INV-7-4	楠	-0.89

将不同的数据框合并在一起，但索引可能并不总是相同

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-04-13 18:32:01

将不同的数据框合并在一起，但索引可能并不总是相同

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-04-13 18:32:01

解决方案1
1 已采纳 2021-04-13 18:32:01