繁体   English   中英

如何根据列条件执行行明智求和并将Class Wise特定值添加为列?

[英]How to perform Row wise sum based on column condition and add Class Wise specific value as Column?

Cluster Class   Value
0   0   10       1
1   0   11       1
2   0   14       3
3   0   18       1
4   0   26       1
5   0   29       1
6   0   30       1
7   1   0        2
8   1   19       1
9   1   20       1
10  1   21       2
11  1   36       1
12  1   26       1
13  1   27       1
14  1   37       2
15  1   33       1

这个表是根据 Which class falls under which Cluster 得出的。 像Class 10, 11, 14等等都落入了Cluster 0。而Value列表示class成员有多少。 像 Class 14 中的 3 个成员落入了 Cluster 0。

现在我想要的 output 是这样的:

    Cluster Class   Value   Cluster_Sum

    0   0   10      1               9
    1   0   11      1               9
    2   0   14      3               9
    3   0   18      1               9
    4   0   26      1               9
    5   0   29      1               9
    6   0   30      1               9

其他集群也一样。 我的最终目标是创建一个专栏“Precision”,它是
df['Precision'] = df['Value']/ df['Cluster_Sum']每行。

我怎样才能使用 python 做到这一点?

编辑:- 它工作得很好。 谢谢你的帮助。


最终这是我的目标 对于每个 class,它的编号是固定的。 比如 Class 1:10, Class 2:12....等等。 我需要添加一个像“Class_Sum”这样的列。 其中包含总共 class 的数据。然后我可以通过以下方式找到召回

`df['Recall'] = df['Value']/ df['Class_Sum']`

但我的问题是我怎么能 append 这个我的信息

Class 1     10
Class 2     12
Class 3     23
Class 4     11
Class 5     17
Class 6     13
Class 7     16
Class 8     15
Class 9     14
Class 10    18
Class 11    09
Class 12    07
Class 13    16
Class 14    21
Class 15    17
Class 16    23
Class 17    10
Class 18    21
Class 19    12
Class 20    45
Class 21    12
Class 22    12
Class 23    15
Class 24    11
Class 25    09
Class 26    11
Class 27    08
Class 28    10
Class 29    11
Class 30    19
Class 31    17
Class 32    15
Class 33    12
Class 34    07
Class 35    06
Class 36    14
Class 37    13
Class 38    16

像这样给我的 Dataframe

 Cluster   Class          Class_SUm  Value ClusSum Precision RCll 
          10                  18
          11                  09
          14                  21
          18                  21
          26                  11
          29                  11
          30                  19

如何做呢?

尝试使用groupby

df["Cluster_Sum"] = df.groupby("Cluster")["Value"].transform("sum")

>>> df
    Cluster  Class  Value  Cluster_Sum
0         0     10      1            9
1         0     11      1            9
2         0     14      3            9
3         0     18      1            9
4         0     26      1            9
5         0     29      1            9
6         0     30      1            9
7         1      0      2           12
8         1     19      1           12
9         1     20      1           12
10        1     21      2           12
11        1     36      1           12
12        1     26      1           12
13        1     27      1           12
14        1     37      2           12
15        1     33      1           12

groupby + transform("sum")是你的朋友:

df['Precision'] = df["Value"] / df.groupby("Cluster")["Value"].transform("sum")

Output:

>>> df
    Cluster  Class  Value  Precision
0         0     10      1   0.111111
1         0     11      1   0.111111
2         0     14      3   0.333333
3         0     18      1   0.111111
4         0     26      1   0.111111
5         0     29      1   0.111111
6         0     30      1   0.111111
7         1      0      2   0.166667
8         1     19      1   0.083333
9         1     20      1   0.083333
10        1     21      2   0.166667
11        1     36      1   0.083333
12        1     26      1   0.083333
13        1     27      1   0.083333
14        1     37      2   0.166667
15        1     33      1   0.083333

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM