根据 pandas 中的另一个填充 dataframe 中的单元格

Question

我有两个数据框，例如

表 1：

ORFs_values      Groups       SP1  SP2   SP3
SP_ORF1          Group1       1    1     0
SP_ORF1          Group2       0    0     0
SP_ORF1          Group3       0    1     0
SP_ORF1          Group4       1    1     1

另一个：

选项卡2

Groups         SP_names   SP_names2
Group1         SP1        SP1_A
Group1         SP2        SP2_A
Group3         SP2        SP2_BL
Group4         SP1        SP1_BI
Group4         SP2        SP2_OP
Group4         SP3        SP3_I

我想在Tab1中用 1 替换所有单元格，并用它们对应的SP_names2每个匹配的Groups和SP_names 。

例如，在Tab1的第一行中， Group1中SP1的SP_names2值为SP1_A ，所以我将 1 替换为SP1_A等等......

然后我应该得到以下 output：

新标签1：

ORFs_values      Groups       SP1      SP2       SP3
SP_ORF1          Group1       SP1_A    SP2_A     0
SP_ORF1          Group2       0         0        0
SP_ORF1          Group3       0         SP2_BL   0
SP_ORF1          Group4       SP1_BI    SP2_OP   SP3_I

如果有帮助，这里有两个 df 格式的 df：

选项卡1

{'ORFs_values': {0: 'SP_ORF1', 1: 'SP_ORF1', 2: 'SP_ORF1', 3: 'SP_ORF1'}, 'Groups': {0: 'Group1', 1: 'Group2', 2: 'Group3', 3: 'Group4'}, 'SP1': {0: 1, 1: 0, 2: 0, 3: 1}, 'SP2': {0: 1, 1: 0, 2: 1, 3: 1}, 'SP3': {0: 0, 1: 0, 2: 0, 3: 1}}

选项卡2

{'Groups': {0: 'Group1', 1: 'Group1', 2: 'Group3', 3: 'Group4', 4: 'Group4', 5: 'Group4'}, 'SP_names': {0: 'SP1', 1: 'SP2', 2: 'SP2', 3: 'SP1', 4: 'SP2', 5: 'SP3'}, 'SP_names2': {0: 'SP1_A', 1: 'SP2_A', 2: 'SP2_BL', 3: 'SP1_BI', 4: 'SP2_OP', 5: 'SP3_I'}}

Answer 1

这是使用mask()的解决方案

df是 Tab1， df2是 Tab2

df = df.set_index('Groups')
(df.mask(df.eq(1),
         df2.set_index(['Groups','SP_names'])['SP_names2'].unstack())
 .reset_index())

Output：

   Groups ORFs_values     SP1     SP2    SP3
0  Group1     SP_ORF1   SP1_A   SP2_A      0
1  Group2     SP_ORF1       0       0      0
2  Group3     SP_ORF1       0  SP2_BL      0
3  Group4     SP_ORF1  SP1_BI  SP2_OP  SP3_I

根据 pandas 中的另一个填充 dataframe 中的单元格

问题描述

1 个解决方案

解决方案1
0 2022-01-23 17:25:13

根据 pandas 中的另一个填充 dataframe 中的单元格

问题描述

1 个解决方案

解决方案1 0 2022-01-23 17:25:13

解决方案1
0 2022-01-23 17:25:13