[英]Pyspark dataframe replace functions: How to work with special characters in column names?
[英]How to replace any number of special characters with a space in a dataframe column
我在 Pandas 中有一个列,单词之间有许多 @ 字符。 连续@ 的数量是随机的,我不能用单个空格而不是空格替换它们,因为它会产生诸如
原始字符串 | 用''代替 | 替换为 '_' 或单个空格 |
---|---|---|
太阳是@@@@黄色 | 太阳黄 | 太阳是____黄色 |
我想将上面的字符串转换为 - 'Sun is yellow'
有没有办法对整个字符串列执行此操作?
如果需要将一个或多个@
替换为一个空格,请使用正则表达式[@]+
:
df['New string'] = df['Original string'].replace(r'[@]+', ' ', regex=True)
print (df)
Original string New string
0 Sun is@@@@yellow Sun is yellow
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.