根据多列中的值返回熊猫中的行

Question

需要一些有关熊猫的帮助...我正在处理这些数据，并且我正在尝试计算每个区域随时间的一些变化。 基本上，我试图为每个有问题的区域找到最旧的数量和最新的数量。 我有代码可以为我提供最新和最旧数据记录的年份，但是我需要收集整行，以便我可以处理“数量”列。 任何输入？ 这是我所拥有的：

df.groupby(['Country or Area'])['Year'].max()

提前致谢！

Answer 1

df = df.sort_values(by=['Country or Area','Year'])
df.groupby('Country or Area').agg(['first','last']).stack()

Answer 2

使用 idxmin() 和 idxmax()。 就像是：

grp = df.groupby(['Country or Area'])

for name,group in grp:
    print(name)

    minidx = group['Year'].idxmin()
    maxidx = group['Year'].idxmax()

    print(f"min: {group['Year'][minidx]} {group['Quantity'][minidx]}")
    print(f"max: {group['Year'][maxidx]} {group['Quantity'][maxidx]}")
    print()

Answer 3

您可以使用idxmin和idxmax获取最旧和最新idxmax

df.loc[df.groupby(['Country or Area'])['Year'].idxmin()]

Answer 4

您需要使用groupby() 的agg 函数

您可以将函数或函数字典传递给您需要聚合的列

在您的情况下，代码应该像Crish 解决方案是更好的方法。

按要检查的值对数据框进行排序，然后分组并通过.agg()获得您需要的结果

stack()方法用于缩小 df 级别

根据多列中的值返回熊猫中的行

问题描述

4 个解决方案

解决方案1
1 2020-02-15 01:46:51

解决方案2
1 2020-02-15 02:03:14

解决方案3
0 已采纳 2020-02-15 01:51:54

解决方案4
0 2020-02-15 02:20:25

根据多列中的值返回熊猫中的行

问题描述

4 个解决方案

解决方案1 1 2020-02-15 01:46:51

解决方案2 1 2020-02-15 02:03:14

解决方案3 0 已采纳 2020-02-15 01:51:54

解决方案4 0 2020-02-15 02:20:25

解决方案1
1 2020-02-15 01:46:51

解决方案2
1 2020-02-15 02:03:14

解决方案3
0 已采纳 2020-02-15 01:51:54

解决方案4
0 2020-02-15 02:20:25