如果单词在字符串的开头或在一个或多个空格之后，则在单词之后添加一个空格，同时它必须在结尾或之前 \n

Question

import re

line = "treinta y un"       #example 1
line = "veinti un "         #example 2
line = "un"                 #example 3
line = "un "                #example 4
line = "uno"                #example 5
line = "treinta yun"        #example 6
line = "treinta y unghhg"   #example 7

re_for_identificate_1 = "(?<!^)un"
re_for_identificate_2 = " un"

line = re.sub(re_for_identificate_2, " un ", line)
line = re.sub(re_for_identificate_1, "un ", line)

print(repr(line))

如何从这些输入中获得这些输出？

"treinta y un "       #for example 1
"veinti un "          #for example 2
"un "                 #for example 3
"un "                 #for example 4
"uno"                 #for example 5
"treinta yun"         #for example 6
"treinta y unghhg"    #for example 7

请注意，对于示例 4、5、6 和 7，正则表达式不应进行任何更改，因为在单词之后已经放置了一个空格，或者因为在"uno"的情况下，单词"un"不在末尾句子的开头，或者在"treinta yun"的情况下，substring "un"前面没有一个或多个空格。

Answer 1

我不确定你需要正则表达式。 以下代码似乎可以实现您想要的。

执行三项检查：

内容是一个字符串
最后两个字符是“un”
最后一个字是“un”

在这里，我将逻辑包装在列表理解中以进行演示。

lines = ["treinta y un", "veinti un ", "un", "un ",
         "uno", "treinta yun", "treinta y unghhg"]

result = [ line+" " if (isinstance(line, str) 
                    and (line[-2:] == "un") 
                    and (line.split()[-1] == "un"))
          else line 
          for line in lines ]

for line in result:
    print(f"'{line}'")

Output：

'treinta y un '
'veinti un '
'un '
'un '
'uno'
'treinta yun'
'treinta y unghhg'

Answer 2

如果要使用正则表达式，可以使用\bun$ ，它会检查字符串中的最后一个完整单词是否为un ，并且字符串中后面没有任何内容。 如果是这种情况，则在字符串末尾添加一个空格：

import re

lines = ["treinta y un", "veinti un ", "un", "un ",
         "uno", "treinta yun", "treinta y unghhg"]

result = [re.sub(r'\bun$', 'un ', line) for line in lines]

Output：

[
 'treinta y un ',
 'veinti un ',
 'un ',
 'un ',
 'uno',
 'treinta yun',
 'treinta y unghhg'
]

Answer 3

如果你在你的代码中声明line = ，你每次都会覆盖它。

使用(?<!^)un断言字符串的开头不是直接在左侧。

如果您还想排除#un的匹配项，您可以使用(?<\S)代替断言左侧的空白边界。

要确保模式位于字符串的末尾，您可以使用锚$

代码示例使用单行，但如果您想在多行时进行替换，则必须将多行标志re.MULTILINE与re.sub一起使用。

例子

import re

pattern = r"(?<!\S)un$"

lines = ["treinta y un", "veinti un ", "un", "un ",
         "uno", "treinta yun", "treinta y unghhg", "#un"]

print([re.sub(pattern, 'un ', line) for line in lines])

Output

[
  'treinta y un ',
  'veinti un ',
  'un ',
  'un ',
  'uno',
  'treinta yun',
  'treinta y unghhg',
  '#un'
]

如果单词在字符串的开头或在一个或多个空格之后，则在单词之后添加一个空格，同时它必须在结尾或之前 \n

问题描述

3 个解决方案

解决方案1
1 2022-09-24 05:25:01

解决方案2
1 已采纳 2022-09-24 05:36:07

解决方案3
1 2022-09-24 11:40:53

如果单词在字符串的开头或在一个或多个空格之后，则在单词之后添加一个空格，同时它必须在结尾或之前 \n

问题描述

3 个解决方案

解决方案1 1 2022-09-24 05:25:01

解决方案2 1 已采纳 2022-09-24 05:36:07

解决方案3 1 2022-09-24 11:40:53

解决方案1
1 2022-09-24 05:25:01

解决方案2
1 已采纳 2022-09-24 05:36:07

解决方案3
1 2022-09-24 11:40:53