获取dataframe中某列第一次出现的索引

Question

我有以下 dataframe：

import pandas as pd
d = {'Stages': ['Stage 1', 'Stage 2', 'Stage 2', 'Stage 2', 'Stage 3', 'Stage 1'], 'Start(s)': [0, 630, 780, 840, 900, 930], 'End(s)': [630, 780, 840, 900, 930, 960]}
df = pd.DataFrame(data=d)

    Stages         Start(s) End(s)
0   Stage 1          0      630
1   Stage 2         630     780
2   Stage 2         780     840
3   Stage 2         840     900
4   Stage 3         900     930
5   Stage 1         930     960

我想获取第 2 阶段首次出现在“阶段”列中的索引。在此示例中，它将是 1。

我尝试阅读有关类似问题的讨论，但无法实施。

Answer 1

如果始终存在至少一个Stage 2 ，请使用Series.idxmax比较第一个值：

print (df['Stages'].eq('Stage 2').idxmax())
1

如果可能不存在像Stage 8这样的next和iter技巧：

print (next(iter(df.index[df['Stages'].eq('Stage 8')]), 'not exist'))
not exist

print (next(iter(df.index[df['Stages'].eq('Stage 2')]), 'not exist'))
1

因为如果不存在匹配值idxmax返回第一个False值：

print (df['Stages'].eq('Stage 8').idxmax())
0

另一个想法是通过Series.where和Series.first_valid_index测试不缺失值的第一个索引：

print (df['Stages'].where(df['Stages'].eq('Stage 8')).first_valid_index())
None

print (df['Stages'].where(df['Stages'].eq('Stage 2')).first_valid_index())
1

获取dataframe中某列第一次出现的索引

问题描述

1 个解决方案

解决方案1
3 已采纳 2023-01-21 22:54:27

获取dataframe中某列第一次出现的索引

问题描述

1 个解决方案

解决方案1 3 已采纳 2023-01-21 22:54:27

解决方案1
3 已采纳 2023-01-21 22:54:27