確定組中具有最高價值的行，並提取在Pandas中具有相同名稱的所有行

Question

我有一個csv文件，其數據排列如下：

       Letter  Subject    Score
    0    A     Knitting    78
    1    A     Knitting    60
    2    A     Knitting    42
    3    B     Knitting    30
    4    B     Knitting    48
    5    C     Diving      23
    6    C     Diving      56
    7    C     Diving      23
    8    D     Diving      78
    ......

將CSV讀入Pandas后，我想做的事情如下：

按分數標題對行進行排序
按主題分組
確定每個主題組中得分最高的字母。
刪除所有帶字母的行。

我可以做到1和2，但是我和3和4並不能纏在一起。 有人對熊貓有經驗嗎？

Answer 1

這是一種方法：

df[~df['Letter'].isin(df.set_index('Letter').groupby('Subject')['Score'].idxmax())]
Out: 
  Letter   Subject  Score
3      B  Knitting     30
4      B  Knitting     48
5      C    Diving     23
6      C    Diving     56
7      C    Diving     23

df.set_index('Letter').groupby('Subject')['Score'].idxmax()返回每個主題組得分最高的字母。 我需要將索引臨時設置為字母，以獲取字母而不是索引。 輸出為：

df.set_index('Letter').groupby('Subject')['Score'].idxmax()
Out: 
Subject
Diving      D
Knitting    A
Name: Score, dtype: object

現在，使用布爾索引，您可以使用Series.isin選擇其對應字母不在列表['D', 'A']的Series.isin 。

確定組中具有最高價值的行，並提取在Pandas中具有相同名稱的所有行

問題描述

1 個解決方案

解決方案1
2 已采納 2016-12-09 21:10:47

確定組中具有最高價值的行，並提取在Pandas中具有相同名稱的所有行

問題描述

1 個解決方案

解決方案1 2 已采納 2016-12-09 21:10:47

解決方案1
2 已采納 2016-12-09 21:10:47