[英]Extracting portions of the entries of Pandas dataframe
我有一个包含多列的 Pandas 数据框,其中每列的条目都是数字、大小写字母和一些特殊字符的组合:即"=A-Za-z0-9_|"
. 该列的每个条目都是以下形式:
'x=ABCDefgh_5|123|'
我只想保留仅出现在| |
之间的数字0-9
| |
并删除所有其他字符。 这是我的数据框一列的代码:
list(map(lambda x: x.lstrip(r'\[=A-Za-z_|,]+'), df[1]))
但是,代码返回完整条目'x=ABCDefgh_5|123|'
没有剥离任何东西。 我的代码有错误吗?
与其使用这些不可读的正则表达式,不如考虑简单的拆分。 例如:
import pandas as pd
d = {'col': ["x=ABCDefgh_5|123|", "x=ABCDefgh_5|123|"]}
df = pd.DataFrame(data=d)
output = df["col"].str.split("|").str[1]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.