查找数据框列中值第一次出现的日期 - 查找每列的开始日期

Question

如何在此数据框中查找 A 列和 B 列第一次出现值的日期？

所以，我想要A 的2012-04-03和B列的2012-04-04 ：

|                     |   A |   B |
|:--------------------|----:|----:|
| 2012-04-01 00:00:00 | nan | nan |
| 2012-04-02 00:00:00 | nan | nan |
| 2012-04-03 00:00:00 |   4 | nan | <- First occurrence of A
| 2012-04-04 00:00:00 |   6 |   2 | <- First occurrence of B
| 2012-04-05 00:00:00 |   5 | nan |
| 2012-04-06 00:00:00 | nan |   2 |
| 2012-04-07 00:00:00 |   8 |   3 |
| 2012-04-08 00:00:00 |   4 | nan |

这是制作df的代码：

df = pd.DataFrame(data={"A":[np.NaN, np.NaN, 4,6,5,np.NaN,8,4],"B":[np.NaN,np.NaN,np.NaN,2,np.NaN,2,3, np.NaN,]}, index=pd.date_range('2012-04-01', '2012-04-08'))

我尝试遍历列，然后使用dropna()摆脱NaNs ，然后通过索引检索日期。 ...我相信有更好的方法。

Answer 1

使用first_valid_index ：

>>> df.apply(lambda x: x.first_valid_index())
A   2012-04-03
B   2012-04-04
dtype: datetime64[ns]

Answer 2

for col in df.columns:
    print(df[df[col].notna()].head(1))

查找数据框列中值第一次出现的日期 - 查找每列的开始日期

问题描述

2 个解决方案

解决方案1
2 已采纳 2022-07-11 22:00:02

解决方案2
0 2022-07-11 22:00:40

查找数据框列中值第一次出现的日期 - 查找每列的开始日期

问题描述

2 个解决方案

解决方案1 2 已采纳 2022-07-11 22:00:02

解决方案2 0 2022-07-11 22:00:40

解决方案1
2 已采纳 2022-07-11 22:00:02

解决方案2
0 2022-07-11 22:00:40