簡體   English   中英

提取 Pandas 數據框的部分條目

[英]Extracting portions of the entries of Pandas dataframe

我有一個包含多列的 Pandas 數據框,其中每列的條目都是數字、大小寫字母和一些特殊字符的組合:即"=A-Za-z0-9_|" . 該列的每個條目都是以下形式:

'x=ABCDefgh_5|123|'

我只想保留僅出現在| |之間的數字0-9 | | 並刪除所有其他字符。 這是我的數據框一列的代碼:

list(map(lambda x: x.lstrip(r'\[=A-Za-z_|,]+'), df[1]))

但是,代碼返回完整條目'x=ABCDefgh_5|123|' 沒有剝離任何東西。 我的代碼有錯誤嗎?

與其使用這些不可讀的正則表達式,不如考慮簡單的拆分。 例如:

import pandas as pd

d = {'col': ["x=ABCDefgh_5|123|", "x=ABCDefgh_5|123|"]}
df = pd.DataFrame(data=d)

output = df["col"].str.split("|").str[1]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM