从 dataframe 计算百分比，它在“值”列中具有相同的 id 和多个值

Question

我有一个 dataframe 有 45 个唯一值，对应的是其他值，如“面包”、“切片”、果冻和粉末。

这是我组成的数据集：

Value_ID     Value
1000         bread
1000         bread
1000         bread
1000         bread
1000         jelly
1000         bread
1001         powder
1001         bread
1001         bread
1001         bread
1001         bread
1002         slice 
1002         powder
1002         bread
1002         jelly

在这里，我试图从数据中获取 Value_ID 的数量（计数），其中 value-ID 包含大于或等于 80% 的面包，在本例中为 2，value_id 为 1001 和 1002。

Answer 1

您可以在 boolean 系列上使用grouby.mean来获取面包上的比例，然后过滤：

(df['Value'].eq('bread')
 .groupby(df['Value_ID']).mean()
 .loc[lambda x: x>=0.8]
 .index.to_list()
)

output: [1000, 1001]

中间的：

(df['Value'].eq('bread')
 .groupby(df['Value_ID']).mean()
)

output：

Value_ID
1000    0.833333
1001    0.800000
1002    0.250000
Name: Value, dtype: float64

从 dataframe 计算百分比，它在“值”列中具有相同的 id 和多个值

问题描述

1 个解决方案

解决方案1
1 2022-09-12 18:35:19

从 dataframe 计算百分比，它在“值”列中具有相同的 id 和多个值

问题描述

1 个解决方案

解决方案1 1 2022-09-12 18:35:19

解决方案1
1 2022-09-12 18:35:19