刪除重復項時忽略區分大小寫，並在python中的pandas dataframe中添加第一個值和第一個列值

Question

我有一個df，

Name    Count
Ram     1
ram     2
raM     1
Arjun   3
arjun   4

我想要的輸出df，

Name    Count
Ram     4
Arjun   7

我試過groupby但是我無法達到所需的輸出，請幫忙

Answer 1

使用agg由值Name小號轉換為lower - first和sum ：

df = (df.groupby(df['Name'].str.lower(), as_index=False, sort=False)
        .agg({'Name':'first', 'Count':'sum'}))
print (df)
    Name  Count
0    Ram      4
1  Arjun      7

詳情：

print (df['Name'].str.lower())
0      ram
1      ram
2      ram
3    arjun
4    arjun
Name: Name, dtype: object

Answer 2

In [71]: df.assign(Name=df['Name'].str.capitalize()).groupby('Name', as_index=False).sum()
Out[71]:
    Name  Count
0  Arjun      7
1    Ram      4

Answer 3

如果我按title格式化字符串分組，它簡化了我必須采取的步驟。

df.Count.groupby(df.Name.str.title()).sum().reset_index()

刪除重復項時忽略區分大小寫，並在python中的pandas dataframe中添加第一個值和第一個列值

問題描述

3 個解決方案

解決方案1
5 已采納 2017-11-03 11:53:08

解決方案2
3 2017-11-03 11:58:09

解決方案3
3 2017-11-03 11:58:25

刪除重復項時忽略區分大小寫，並在python中的pandas dataframe中添加第一個值和第一個列值

問題描述

3 個解決方案

解決方案1 5 已采納 2017-11-03 11:53:08

解決方案2 3 2017-11-03 11:58:09

解決方案3 3 2017-11-03 11:58:25

解決方案1
5 已采納 2017-11-03 11:53:08

解決方案2
3 2017-11-03 11:58:09

解決方案3
3 2017-11-03 11:58:25