繁体   English   中英

Python Pandas提取,如何提取字符串的剩余部分

[英]Python pandas extract, how to extract remaining part of string

我已经看了几个小时,这应该很简单。 我试图从带有混合或数字和字母的字符串中提取所有字母。 这是一个例子:

df = pd.Series(['ENGLANDSR11SW'])
df = df.to_frame('column')
df['ValueAfterExtract'] = df['column'].str.extract("(?P<letter>[a-zA-Z]+)")
print(df)

从数据帧中的字符串值ENGLANDSR11SW中,结果是ENGLANDSR但是我想带上字符串的最后一个字母,即SW ,这将导致ENGLANDSRSW ,这意味着只删除了数字11

我怎样才能做到这一点?

用空字符串替换所有数字( \\d ):

In [6]: df['column'].str.replace(r'\d', '')
Out[10]: 
0    ENGLANDSRSW
Name: column, dtype: object

或者,要删除不在[a-zA-Z]使用regexp [^a-zA-Z] 例如,这将删除空格和标点符号以及数字:

In [20]: df['column'].str.replace(r'[^a-zA-Z]', '')
Out[20]: 
0    ENGLANDSRSW
Name: column, dtype: object

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM