簡體   English   中英

熊貓數據框任意兩列之間的百分比差異

[英]Percentage difference between any two columns of pandas dataframe

我想為任意兩個 Pandas 列之間的百分比差異計算定義一個函數。 假設我的數據框由以下定義:

R1  R2    R3    R4   R5    R6
 A   B     1     2    3     4

我希望我的計算定義為

df['R7'] = df[['R3','R4']].apply( method call to calculate perc diff)

df['R8'] = df[['R5','R6']].apply(same method call to calculate perc diff)

怎么做?

我在下面試過

df['perc_cnco_error'] = df[['CumNetChargeOffs_x','CumNetChargeOffs_y']].apply(lambda x,y: percCalc(x,y))

def percCalc(x,y):
    if x<1e-9:
        return 0
    else:
        return (y - x)*100/x

它給了我錯誤信息

類型錯誤:('() 正好有 2 個參數(給定 1 個)',你發生在索引 CumNetChargeOffs_x')

用最簡單的術語來說,這就是你要找的嗎?

def percentage_change(col1,col2):
    return ((col2 - col1) / col1) * 100

您可以將其應用於數據框的任何 2 列:

df['a'] = percentage_change(df['R3'],df['R4'])    
df['b'] =  percentage_change(df['R6'],df['R5'])

Out[220]: 
  R1 R2  R3  R4  R5  R6      a     b
0  A  B   1   2   3   4  100.0 -25.0

這會給你百分比偏差:

df.apply(lambda row: (row.iloc[0]-row.iloc[1])/row.iloc[0]*100, axis=1)

如果您有兩列以上的嘗試,

df[['R3', 'R5']].apply(lambda row: (row.iloc[0]-row.iloc[1])/row.iloc[0]*100, axis=1)

要計算R3R4之間的百分比差異,您可以使用:

df['R7'] = (df.R3 - df.R4) / df.R3 * 100

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM