[英]Why can't I replace target string with regular expression in python?
我想,以取代\\n\\t+
字符串中"2005-03-08\\n\\t\\t\\t\\t\\t10派3元(含税)\\n\\t\\t\\t\\t\\t"
,为什么我不能使它正常工作?
str1="2005-03-08\n\t\t\t\t\t10派3元(含税)\n\t\t\t\t\t"
str2=str1.replace("\n\t+","")
str2
'2005-03-08\n\t\t\t\t\t10派3元(含税)\n\t\t\t\t\t'
为什么我不能得到2005-03-0810派3元(含税)
的结果?
您的代码没有执行正则表达式替换,而是尝试(未成功)使用内置的str.replace
方法。 这不起作用,因为语义不正确。
有两个合理的解决方法:
您可以坚持使用字符串替换,并且只需使用正确的语法即可(但请注意,这将替换所有选项卡,不仅替换换行符的选项卡):
str2 = str1.replace("\\n", "").replace("\\t", "")
您可以导入re
模块并进行预期的替换:
import re str2 = re.sub(r"\\n\\t+", "", str1)
好吧,您的主要原因是因为str2
正在寻找'\\n\\t+'
,这在语句中找不到。 而且,理想的输出将不是这样,因为它正在寻找删除所有 \\n\\t
,但是您的replace()
只寻找直接在\\n
之后的输出。 试试这个代码:
>>> str1="2005-03-08\n\t\t\t\t\t10派3元(含税)\n\t\t\t\t\t"
>>> ideal = "2005-03-0810派3元(含税)" #Just to check if they are the same
>>> str2 = str1.replace('\n', '').replace('\t', '')
>>> str2
'2005-03-0810\xe6\xb4\xbe3\xe5\x85\x83(\xe5\x90\xab\xe7\xa8\x8e)' #The encoded statement
>>> print str2
2005-03-0810派3元(含税)
>>> str2==ideal
True
>>>
你可以做
str2 = ''.join(s.strip() for s in str1.splitlines())
(尽管这也会删除前导和尾随空格)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.