繁体   English   中英

提取 Pandas 数据框的部分条目

[英]Extracting portions of the entries of Pandas dataframe

我有一个包含多列的 Pandas 数据框,其中每列的条目都是数字、大小写字母和一些特殊字符的组合:即"=A-Za-z0-9_|" . 该列的每个条目都是以下形式:

'x=ABCDefgh_5|123|'

我只想保留仅出现在| |之间的数字0-9 | | 并删除所有其他字符。 这是我的数据框一列的代码:

list(map(lambda x: x.lstrip(r'\[=A-Za-z_|,]+'), df[1]))

但是,代码返回完整条目'x=ABCDefgh_5|123|' 没有剥离任何东西。 我的代码有错误吗?

与其使用这些不可读的正则表达式,不如考虑简单的拆分。 例如:

import pandas as pd

d = {'col': ["x=ABCDefgh_5|123|", "x=ABCDefgh_5|123|"]}
df = pd.DataFrame(data=d)

output = df["col"].str.split("|").str[1]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM