繁体   English   中英

从pandas DataFrame返回最后一个有效(非null)值

[英]Returning the last valid (non-null) value from a pandas DataFrame

假设我有一个dataframe如下:

      a      b
0    11      A
1    -2      A
2     3      A
3    NA      A
4   0.5      B
5    NA      B
6    -9      B

我可以用'b'创建一个组。 有没有一种快速的方法来获得每组中'a'的最后一个非NA值? 在这种情况下,对于A组为3,对于B组为-9。

(在这种情况下,系列'a'按给定的顺序排序,但情况可能并非如此。可能有另一列'c',根据该列定义'last'。)

我通过查看groups.groups dict编写了自己的循环代码。 但显然,鉴于我庞大的数据集,效率非常低。 我认为这可以非常直接地完成 - 也许我对熊猫太新手了:-)

我最近为此添加了一个github问题: https//github.com/pydata/pandas/issues/1043

在此期间,你可以这样做:

def get_last_valid(series):
    return series.dropna().iget(-1)

df.groupby('b')['a'].apply(get_last_valid)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM