具有非ASCII字符的正則表達式模式

Question

問題總結

我有此正則表達式python代碼：

在

lst =[' ', 'US$170.8980\xa0billion', '[2]', '\xa0(2018)']
for i in lst:
    pat = re.compile(r'([\x1F-\x7F]+).+(\d+)')
    results=pat.search(i)
    print(results)

我正在使用正則表達式模式獲取此輸出：

出

None
<_sre.SRE_Match object; span=(0, 11), match='US$170.8980'>
None
<_sre.SRE_Match object; span=(1, 6), match='(2018'>

希望的食物

理想情況下，我想獲得以下輸出：

[US$170.8980-billion-(2018)]

Answer 1

也許，這種表達可能與您的想法很接近，

import re

lst =[' ', 'US$170.8980\xa0billion', '[2]', '\xa0(2018)']

output =''
for index,item in enumerate(lst):
    item = item.strip()
    if re.match('\[\d+\]',item) == None:
        if index == len(lst)-1:
            output +='-'
        output += re.sub(r'[^ -~]','-', item)

print(output)

雖然不確定。

輸出量

US$170.8980-billion-(2018)

Answer 2

這對我有用：

string = 'US$170.8980\xa0billion'
pat = ''.join(re.findall('([a-zA-Z0-9$.])', string))

改編

lst = [' ', 'US$170.8980\xa0billion', '[2]', '\xa0(2018)']
for i in lst:
    pat = ''.join(re.findall('([a-zA-Z0-9$.\s])', i))
    print(pat)

選擇：

(re.findall('([^�])', i)

具有非ASCII字符的正則表達式模式

問題描述

問題總結

希望的食物

2 個解決方案

解決方案1
1 2019-08-04 19:05:46

輸出量

解決方案2
1 已采納 2019-08-04 19:31:04

具有非ASCII字符的正則表達式模式

問題描述

問題總結

希望的食物

2 個解決方案

解決方案1 1 2019-08-04 19:05:46

輸出量

解決方案2 1 已采納 2019-08-04 19:31:04

解決方案1
1 2019-08-04 19:05:46

解決方案2
1 已采納 2019-08-04 19:31:04