![](/img/trans.png)
[英]How to remove all special characters except for some, using regex in python
[英]How to remove multiple patterns of special characters in Python Regex Dataframe
所以我有一个名为usa_sub_states
的数据usa_sub_states
其中有一列名为'state'
。
在state
列中,有 5 个带有非字母字符串的状态。
Massachusetts[C]
Pennsylvania[C]
Rhode Island[D]
Virginia[C]
Hawai'i
现在我想知道是否有一种方法可以用空字符串替换所有特殊字符,以便它们都作为常规状态名称出现。
usa_sub_states.state.replace(to_replace=r'[\W]', value='', regex=True, inplace=True)
但由于某种原因,这删除了该列的所有内容并使其成为空字符串。
您可以使用
usa_sub_states.state.replace(to_replace=r'\[[^][]*]|\W', value='', regex=True, inplace=True)
请参阅正则表达式演示。 详情:
\\[[^][]*]
- [
,然后是除[
和]
以外的零个或多个字符|
- 或者\\W
- 任何非字字符。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.