簡體   English   中英

從特定字符開始逐行提取元素

[英]Extract element by line starting with a specific character

我目前正在研究這個 DataFrame python :
提取數據框

數據集有 1 列和 n 行。

我想提取特定行的特定組件,例如:

對於以“n”開頭的每一行 i,將行 i 的第二個元素存儲在變量 x 中。

或者

對於以“e”開頭的每一行 i,將行 i 的第二個和第三個元素存儲在變量 x 中。

我想知道我可以使用哪個函數/操作來解決這個問題。

創建簡單示例:

d = pd.DataFrame({'a': ['aaaak', 'k jhs', 'anhdga', 'kjdhs']})

您可以使用 column.str 並查看第一個字母:

data.a.str[0]

出去:

0    a
1    k
2    a
3    k

你可以檢查這封信是什么:

data.a.str[0] == 'a'

出去:

0     True
1    False
2     True
3    False

你可以只用第一個字母 'a' 調用 raws:

data[data.a.str[0] == 'a']

出去:

        a
0   aaaak
2  anhdga

然后你可以得到另一個從 'a' 開始的 raws 字母:

data[data.a.str[0] == 'a'].a.str[2]

出去:

0    a
2    h

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM