如何在熊貓數據框中獲取具有非零值的max列

Question

我有一個這樣的數據框：

           2017      2018      2012  2015  2014  2016
11647  0.044795  0.000000  0.000000   0.0   0.0   0.0
16389  0.089801  0.044900  0.000000   0.0   0.0   0.0
16404  0.014323  0.000000  0.000000   0.0   0.04   0.0
16407  0.052479  0.010442  0.009277   0.0   0.0   0.0
16409  0.000000  0.000000  0.004883   0.0   0.0   5.0

請注意，列未排序。 對於每一行，我需要獲取非零值的最新年份。 因此，預期結果是：

11647    2017
16389    2018
16404    2017
16407    2018
16409    2016

怎么做？

Answer 1

可以在已排序的df中使用idxmax

df[sorted(df.columns, reverse=True)].ne(0).idxmax(1)

11647    2017
16389    2018
16404    2017
16407    2018
16409    2016
dtype: object

Answer 2

與max使用stack

df[df.ne(0)].stack().reset_index(level=1)['level_1'].max(level=0)
Out[386]: 
11647    2017
16389    2018
16404    2017
16407    2018
16409    2016
Name: level_1, dtype: int64

只是更新

df.ne(0).mul(df.columns).max(1)
Out[423]: 
11647    2017.0
16389    2018.0
16404    2017.0
16407    2018.0
16409    2016.0
dtype: float64

Answer 3

df.apply(lambda row: row[row > 0].index.max(), axis=1)

給出預期的結果。

如何在熊貓數據框中獲取具有非零值的max列

問題描述

3 個解決方案

解決方案1
2 已采納 2018-09-07 16:58:43

解決方案2
1 2018-09-07 18:22:49

解決方案3
0 2018-09-07 16:51:11

如何在熊貓數據框中獲取具有非零值的max列

問題描述

3 個解決方案

解決方案1 2 已采納 2018-09-07 16:58:43

解決方案2 1 2018-09-07 18:22:49

解決方案3 0 2018-09-07 16:51:11

解決方案1
2 已采納 2018-09-07 16:58:43

解決方案2
1 2018-09-07 18:22:49

解決方案3
0 2018-09-07 16:51:11