Python：對於每個唯一的ID，找到它的代碼和它的值並計算比率

Question

實際數據幀包含超過一百萬行。

例如說一個數據框是：

UniqueID  Code  Value  OtherData      
1         A     5      Z01 
1         B     6      Z02
1         C     7      Z03
2         A     10     Z11
2         B     11     Z24
2         C     12     Z23 
3         A     10     Z21
4         B     8      Z10

我想獲得每個 UniqueID 的 A/B 比率並將其放入新的數據框中。 例如，對於 UniqueID 1，其 A/B 的比率 = 5/6。

在 Python 中執行此操作的最有效方法是什么？

想：

UniqueID  RatioAB        
1         5/6
2         10/11
3         Inf
4         0

謝謝你。

Answer 1

一種方法是使用pivot_table ，在多次出現相同字母的情況下與sum聚合（否則一個簡單的樞軸就可以了），並在A和B列上進行評估：

df.pivot_table(index='UniqueID', columns='Code', values='Value', aggfunc='sum').eval('A/B')

    UniqueID
1    0.833333
2    0.909091
3         NaN
4         NaN
dtype: float64

如果每組每個字母最多出現一次：

df.pivot(index='UniqueID', columns='Code', values='Value').eval('A/B')

    UniqueID
1    0.833333
2    0.909091
3         NaN
4         NaN
dtype: float64

Answer 2

如果您只關心 A/B 比率：

df1 = df[df['Code'].isin(['A','B'])][['UniqueID', 'Code', 'Value']]
df1 = df1.pivot(index='UniqueID',
                columns='Code', 
                values='Value')

df1['RatioAB'] = df1['A']/df1['B']

Answer 3

最明顯的方式是通過 groupby。

df.groupby('UniqueID').apply(lambda g: g.query("Code == 'A'")['Value'].iloc[0] / g.query("Code == 'B'")['Value'].iloc[0])

Python：對於每個唯一的ID，找到它的代碼和它的值並計算比率

問題描述

3 個解決方案

解決方案1
3 已采納 2019-12-18 17:07:58

解決方案2
0 2019-12-18 17:04:06

解決方案3
0 2019-12-18 17:16:15

Python：對於每個唯一的ID，找到它的代碼和它的值並計算比率

問題描述

3 個解決方案

解決方案1 3 已采納 2019-12-18 17:07:58

解決方案2 0 2019-12-18 17:04:06

解決方案3 0 2019-12-18 17:16:15

解決方案1
3 已采納 2019-12-18 17:07:58

解決方案2
0 2019-12-18 17:04:06

解決方案3
0 2019-12-18 17:16:15