熊貓：如何按列選擇第一個或最后一個與 drop_duplicates 保持一致

Question

如下圖，name 必須放在fisrt中， team 放在last中。

如何使用.drop_duplicates()或其他方式完成此操作？

   name  team ...
0  john  a    ...
1  mike  b    ...
2  john  c

↓

   name  team ...
0  john  c    ...
1  mike  b    ...

-- 關於評論的補充說明 --

.groupby('name').agg({'team': 'last', 'country': 'first'})

現在的工作方式，如果country的第一行是Nan如果 country 的第一行是 Nan，那么會得到一個不是first一個的值，如下所示。

這是因為Nan的案子被忽略了嗎？ 即使指定了first first Nan ， Nan仍然必須保留。

   name  team  country ...
0  john   a    Nan     ...
1  mike  b     Brazil  ...
2  john  c     Canada  ...

↓

   name  team  country ...
0  john  c     Canada  ...
1  mike  b     Brazil  ...

Answer 1

您可以使用.groupby()函數：

df.groupby('name').agg({'team': 'last'}) 。

請注意，每個名稱返回的值取決於數據框的排序。

熊貓：如何按列選擇第一個或最后一個與 drop_duplicates 保持一致

問題描述

1 個解決方案

解決方案1
1 已采納 2022-06-04 18:32:59

熊貓：如何按列選擇第一個或最后一個與 drop_duplicates 保持一致

問題描述

1 個解決方案

解決方案1 1 已采納 2022-06-04 18:32:59

解決方案1
1 已采納 2022-06-04 18:32:59