如何使用 pivot 表来显示多列之间公共值的百分比？

Question

我有 6 列 - 每列代表不同的公司。 然后，我在 6 列中有 600 多行 1 或 0，表示零件是否与每家公司签订合同（即列）。 这些部分可以在所有公司之间共享（即，每列的值可以为 1，这意味着该部分在所有公司中具有 100% 的通用性）。

我如何在 excel 中直观地表示这一点？ 我是 pivot 表的新手，基本上想分解每一行，看看每家公司之间公共部分的分布情况。

我已经总结了每一行（“总”列）以及每家公司旁边的命中百分比（“1”）。 我希望按公司划分哪些共同部分相对于其他公司。

import pandas as pd
df=pd.DataFrame({'Comp_A':[1,1,1,1,0,1],
                 'Comp_B':[1,1,1,1,1,1],
                 'Comp_C':[1,1,1,1,1,1],
                 'Comp_D':[0,1,1,1,0,1],
                 'Comp_E':[1,0,1,1,0,1],
                 'Comp_F':[1,1,0,1,1,0],
                 'Sum': [df.sum()]})

对于 6 家公司的每一行 - 我想直观地表示找到的 1 和 0 的数量。 这将告诉我有 x 数量的零件在所有公司中 100% 通用，仅在 Comp_B、C 和 D 等。

我对 Excel 或 Python 都开放。

Answer 1

样品 DataFrame

import pandas as pd
df=pd.DataFrame({'Comp_A':[1,1,1,1,0,1],
                 'Comp_B':[1,1,1,1,1,1],
                 'Comp_C':[1,1,1,1,1,1],
                 'Comp_D':[0,1,1,1,0,1],
                 'Comp_E':[1,0,1,1,0,1],
                 'Comp_F':[1,1,0,1,1,0],
                 })
print(df)

   Comp_A  Comp_B  Comp_C  Comp_D  Comp_E  Comp_F
0       1       1       1       0       1       1
1       1       1       1       1       0       1
2       1       1       1       1       1       0
3       1       1       1       1       1       1
4       0       1       1       0       0       1
5       1       1       1       1       1       0

使用DataFrame.apply + Series.value_counts ：

count_df=df.apply(lambda x: x.value_counts(),axis=1).fillna(0)
print(count_df)

     0    1
0  1.0  5.0
1  1.0  5.0
2  1.0  5.0
3  0.0  6.0
4  3.0  3.0
5  1.0  5.0

import matplotlib.pyplot as plt
%matplotlib inline
count_df.plot(kind='bar')

Output 图像：

如您所见，第 3 行对所有公司都是通用的

百分比：

percentages_comun=(df.sum(axis=1)/len(df.columns))*100
print(percentages_comun)
0     83.333333
1     83.333333
2     83.333333
3    100.000000
4     50.000000
5     83.333333
dtype: float64

percentages_comun.plot(kind='bar')

Output 图像：

如何使用 pivot 表来显示多列之间公共值的百分比？

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-10-31 17:57:13

如何使用 pivot 表来显示多列之间公共值的百分比？

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-10-31 17:57:13

解决方案1
1 已采纳 2019-10-31 17:57:13