Python Pandas - 如何根据列值删除重复项

Question

所以，我想像下面这样转换一个表：输入数据

像这样进入表格： Output 数据

目标是删除重复项，同时以 True、False 表示法保存有关“Value_c”列中值的信息。

Answer 1

您可以在get_dummies上使用groupby来获得所需的 output。

>>> df = pd.DataFrame({"A":[1,1,1,2,2,2], "B":[1,1,1,2,2,2], "C":["Q","R","QR","R","QR","Q"], "D":[1,1,1,2,2,2], "E":["X","X","X","Y","Y","Y"]})
>>> df
   A  B   C  D  E
0  1  1   Q  1  X
1  1  1   R  1  X
2  1  1  QR  1  X
3  2  2   R  2  Y
4  2  2  QR  2  Y
5  2  2   Q  2  Y
>>> df = pd.get_dummies(df, columns=["C","E"])
>>> df.groupby(["A","B","D"]).agg(sum).reset_index()
   A  B  D  C_Q  C_QR  C_R  E_X  E_Y
0  1  1  1    1     1    1    3    0
1  2  2  2    1     1    1    0    3
>>> df.groupby(["A","B","D"]).agg(max).reset_index()
   A  B  D  C_Q  C_QR  C_R  E_X  E_Y
0  1  1  1    1     1    1    1    0
1  2  2  2    1     1    1    0    1
>>>

Python Pandas - 如何根据列值删除重复项

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-09-22 14:07:12

Python Pandas - 如何根据列值删除重复项

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-09-22 14:07:12

解决方案1
1 已采纳 2020-09-22 14:07:12