[英]Python : How to compare strings and ignore white space and special characters
[英]How to ignore white space inbetween words but not other characters?
我想重命名一长串文件名,以使它们更易于搜索。 自动生成的名称,因此存在一些奇怪的间距问题。 我写了一个小蟒蛇脚本来做我想要的。 但我不想删除单词之间的空格。 例如,我有两个名字:
0 130 — HG — 1500 — 12" (Page 1 of 2)
01 30 — HD LOW POINT DRAIN
他们应该读:
0130-HG-1500-12"
0130-HD LOW POINT DRAIN
我的代码到目前为止:
import os
import re
for filename in os.listdir("."):
if not filename.endswith(".py"):
os.replace(filename, re.sub("[(].*?[)]", "", # Remove anything between ()
"".join(filename.split() # Remove any whitespaces
).replace("—", "-"))) # Replace Em dash with hyphen
一切都在工作,除了我无法弄清楚如何不在单词之间剥离白色空格。
如果用“单词”表示“由字母组成的字符串”那么
re.sub('((?<=[^a-zA-Z]) | (?=[^a-zA-Z]))', '', filename)
会做的。 用简单的语言来说,这将“替换任何非字母字符之后或之前的所有空格”。 输出:
In [24]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '01 30 — HD LOW POINT DRAIN ')
Out[24]: '0130—HD LOW POINT DRAIN'
In [25]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '0 130 — HG — 1500 — 12"')
Out[25]: '0130—HG—1500—12"'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.