确定组中具有最高价值的行，并提取在Pandas中具有相同名称的所有行

Question

我有一个csv文件，其数据排列如下：

       Letter  Subject    Score
    0    A     Knitting    78
    1    A     Knitting    60
    2    A     Knitting    42
    3    B     Knitting    30
    4    B     Knitting    48
    5    C     Diving      23
    6    C     Diving      56
    7    C     Diving      23
    8    D     Diving      78
    ......

将CSV读入Pandas后，我想做的事情如下：

按分数标题对行进行排序
按主题分组
确定每个主题组中得分最高的字母。
删除所有带字母的行。

我可以做到1和2，但是我和3和4并不能缠在一起。 有人对熊猫有经验吗？

Answer 1

这是一种方法：

df[~df['Letter'].isin(df.set_index('Letter').groupby('Subject')['Score'].idxmax())]
Out: 
  Letter   Subject  Score
3      B  Knitting     30
4      B  Knitting     48
5      C    Diving     23
6      C    Diving     56
7      C    Diving     23

df.set_index('Letter').groupby('Subject')['Score'].idxmax()返回每个主题组得分最高的字母。 我需要将索引临时设置为字母，以获取字母而不是索引。 输出为：

df.set_index('Letter').groupby('Subject')['Score'].idxmax()
Out: 
Subject
Diving      D
Knitting    A
Name: Score, dtype: object

现在，使用布尔索引，您可以使用Series.isin选择其对应字母不在列表['D', 'A']的Series.isin 。

确定组中具有最高价值的行，并提取在Pandas中具有相同名称的所有行

问题描述

1 个解决方案

解决方案1
2 已采纳 2016-12-09 21:10:47

确定组中具有最高价值的行，并提取在Pandas中具有相同名称的所有行

问题描述

1 个解决方案

解决方案1 2 已采纳 2016-12-09 21:10:47

解决方案1
2 已采纳 2016-12-09 21:10:47