[英]Extracting portions of the entries of Pandas dataframe
我有一個包含多列的 Pandas 數據框,其中每列的條目都是數字、大小寫字母和一些特殊字符的組合:即"=A-Za-z0-9_|"
. 該列的每個條目都是以下形式:
'x=ABCDefgh_5|123|'
我只想保留僅出現在| |
之間的數字0-9
| |
並刪除所有其他字符。 這是我的數據框一列的代碼:
list(map(lambda x: x.lstrip(r'\[=A-Za-z_|,]+'), df[1]))
但是,代碼返回完整條目'x=ABCDefgh_5|123|'
沒有剝離任何東西。 我的代碼有錯誤嗎?
與其使用這些不可讀的正則表達式,不如考慮簡單的拆分。 例如:
import pandas as pd
d = {'col': ["x=ABCDefgh_5|123|", "x=ABCDefgh_5|123|"]}
df = pd.DataFrame(data=d)
output = df["col"].str.split("|").str[1]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.