如何在python中使用正则表达式从字符串中提取小数点数字和百分比

Question

我希望从数千条评论中提取百分比，但格式各不相同。 一个人可能将 10% 写为 10 或 10% 或 10.00% 或 10.0，所以我需要能够处理这些可能性中的任何一种。 我有两个问题，第一个是我的代码在可用时没有捕获 % ，第二个是有时正则表达式语句多次捕获某个数字。

FA_comment = "WPSGX 7.69% SVAIX 7.69% IWP 3.85% FLMVX 3.85% QUAYX 3.85% DEVLX 3.85% TINGX 19.23% TGVIX 23.08% ASYLX 15.38% CEMVX 11.54%"
tickers = re.findall(r'\b[A-Z]{2,5}\b', FA_comment)
numbers = re.findall(r'((\d{1,2}(\.\d{1,2})*))[%]?', FA_comment)
print(FA_comment)
print(tickers)
print(numbers

这是我得到的输出：

WPSGX 7.69% SVAIX 7.69% IWP 3.85% FLMVX 3.85% QUAYX 3.85% DEVLX 3.85% TINGX 19.23% TGVIX 23.08% ASYLX 15.38% CEMVX 11.54%
[u'WPSGX', u'SVAIX', u'IWP', u'FLMVX', u'QUAYX', u'DEVLX', u'TINGX', u'TGVIX', u'ASYLX', u'CEMVX']
[(u'7.69', u'7.69', u'.69'), (u'7.69', u'7.69', u'.69'), (u'3.85', u'3.85', u'.85'), (u'3.85', u'3.85', u'.85'), (u'3.85', u'3.85', u'.85'), (u'3.85', u'3.85', u'.85'), (u'19.23', u'19.23', u'.23'), (u'23.08', u'23.08', u'.08'), (u'15.38', u'15.38', u'.38'), (u'11.54', u'11.54', u'.54')]

这是我想得到的输出：

[u'WPSGX', u'SVAIX', u'IWP', u'FLMVX', u'QUAYX', u'DEVLX', u'TINGX', u'TGVIX', u'ASYLX', u'CEMVX']
[u'7.69%', u'7.69%', u'3.85%', u'3.85%', u'3.85%', u'3.85%', u'19.23%', u'23.08', u'15.38%', u'11.54%']

Answer 1

将re.findall与两个捕获组一起使用，一个用于标签，另一个用于百分比。 然后，使用列表理解来生成您期望的标签/百分比的一维列表。

FA_comment = "WPSGX 7.69% SVAIX 7.69% IWP 3.85% FLMVX 3.85% QUAYX 3.85% DEVLX 3.85% TINGX 19.23% TGVIX 23.08% ASYLX 15.38% CEMVX 11.54%"
pcts = re.findall(r'\b([A-Z]+) (\d+(?:\.\d+)?%?(?!\S))', FA_comment)
print([i[0] for i in pcts])
print([i[1] for i in pcts])

这打印：

['WPSGX', 'SVAIX', 'IWP', 'FLMVX', 'QUAYX', 'DEVLX', 'TINGX', 'TGVIX',
 'ASYLX', 'CEMVX']
['7.69%', '7.69%', '3.85%', '3.85%', '3.85%', '3.85%', '19.23%', '23.08%',
 '15.38%', '11.54%']

如何在python中使用正则表达式从字符串中提取小数点数字和百分比

问题描述

1 个解决方案

解决方案1
2 已采纳 2019-12-20 15:47:59

如何在python中使用正则表达式从字符串中提取小数点数字和百分比

问题描述

1 个解决方案

解决方案1 2 已采纳 2019-12-20 15:47:59

解决方案1
2 已采纳 2019-12-20 15:47:59