簡體   English   中英

在 pandas 中遞增列標題

[英]Incrementing column headers in pandas

您能幫我解決以下問題嗎?

從下面給出的初始數據框中,我想根據這樣的列條件創建一個新的數據框:

if mean > median, add 1 to A & -1 to B, elif mean < median, add -1 to A & 1 to B, else add 0 to both A and B.

初始數據框:

    A/B     A/C     A/D     B/C     B/D     C/D
0   0.75    0.61    1.07    0.82    1.43    1.75
1   1.21    10.88   2.17    9       1.8     0.2
2   0.95    0.85    1.97    0.9     2.08    2.32
3   0.47    0.47    0.91    1       1.94    1.94

平均值和中位數

然后最終的 output 數據幀應該包括所有元素的總分,如下所示:

輸出數據框

提前謝謝你。

利用:

#count mean and median
df1 = df.agg(['mean','median']).round(2)
#difference in sample data so set 0.85
df1.loc['mean', 'A/B'] = 0.85

首先轉置 DataFrame 並通過str.splitindex拆分為MultiIndex

df1 = df1.T
df1.index = df1.index.str.split('/', expand=True)

然后將meanmedian進行比較,並在numpy.select中設置新的 2 列:

m1 = df1['mean'].gt(df1['median']).to_numpy()[:, None]
m2 = df1['mean'].eq(df1['median']).to_numpy()[:, None]

df1 = pd.DataFrame(np.select([m1, m2], [[1,-1], [0,0]], [-1, 1]),
                   index=df1.index,
                   columns=['a','b'])
print (df1)
      a  b
A B   0  0
  C   1 -1
  D   1 -1
B C   1 -1
  D  -1  1
C D  -1  1

最后使用每個索引的sum並連接在一起:

df2 = (pd.concat([df1.a.droplevel(1), df1.b.droplevel(0)])
         .sum(level=0)
         .rename_axis('Element')
         .reset_index(name='Total Score'))
print (df2)
  Element  Total Score
0       A            2
1       B            0
2       C           -3
3       D            1

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM