繁体   English   中英

如何忽略单词之间的空格而不忽略其他字符?

[英]How to ignore white space inbetween words but not other characters?

我想重命名一长串文件名,以使它们更易于搜索。 自动生成的名称,因此存在一些奇怪的间距问题。 我写了一个小蟒蛇脚本来做我想要的。 但我不想删除单词之间的空格。 例如,我有两个名字:

0 130 — HG — 1500 — 12"  (Page 1 of 2)  
01 30 — HD LOW POINT DRAIN  

他们应该读:

0130-HG-1500-12"  
0130-HD LOW POINT DRAIN  

我的代码到目前为止:

import os
import re

for filename in os.listdir("."):
    if not filename.endswith(".py"):
        os.replace(filename, re.sub("[(].*?[)]", "",  # Remove anything between ()
                                    "".join(filename.split()  # Remove any whitespaces
                                            ).replace("—", "-")))  # Replace Em dash with hyphen  

一切都在工作,除了我无法弄清楚如何不在单词之间剥离白色空格。

如果用“单词”表示“由字母组成的字符串”那么

re.sub('((?<=[^a-zA-Z]) | (?=[^a-zA-Z]))', '', filename)

会做的。 用简单的语言来说,这将“替换任何非字母字符之后或之前的所有空格”。 输出:

In [24]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '01 30 — HD LOW POINT DRAIN  ')
Out[24]: '0130—HD LOW POINT DRAIN'

In [25]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '0 130 — HG — 1500 — 12"')
Out[25]: '0130—HG—1500—12"'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM