从特定字符开始逐行提取元素

Question

我目前正在研究这个 DataFrame python ：
提取数据框

数据集有 1 列和 n 行。

我想提取特定行的特定组件，例如：

对于以“n”开头的每一行 i，将行 i 的第二个元素存储在变量 x 中。

或者

对于以“e”开头的每一行 i，将行 i 的第二个和第三个元素存储在变量 x 中。

我想知道我可以使用哪个函数/操作来解决这个问题。

Answer 1

创建简单示例：

d = pd.DataFrame({'a': ['aaaak', 'k jhs', 'anhdga', 'kjdhs']})

您可以使用 column.str 并查看第一个字母：

data.a.str[0]

出去：

你可以检查这封信是什么：

data.a.str[0] == 'a'

出去：

0     True
1    False
2     True
3    False

你可以只用第一个字母 'a' 调用 raws：

data[data.a.str[0] == 'a']

出去：

        a
0   aaaak
2  anhdga

然后你可以得到另一个从 'a' 开始的 raws 字母：

data[data.a.str[0] == 'a'].a.str[2]

出去：

0    a
2    h