Python正則表達式從字符串中提取數據

Question

我有一個文本文件，具有以下形式的行：

c="etc etc etc" 124:1 124:1||r="TrNAP etc"||c="etc etc" 124:10 124:10

引號中的文本逐行變化，數字也是如此。 否則格式不變。 數字表示其他文檔中引號中文本的行號和字號(line#:word#) 。

有人可以提供一些示例正則表達式代碼來提取line#:word#數字嗎？ 謝謝！

Answer 1

>>> import re
>>> c = '"etc etc etc" 124:1 124:1||r="TrNAP etc"||c="etc etc" 124:10 124:10'
>>> print re.findall(r"(\d+):(\d+)", c)
[('124', '1'), ('124', '1'), ('124', '10'), ('124', '10')]

Answer 2

您可以使用以下內容：

(\d+:\d+)

見演示

Answer 3

對於包含所有變量的完整行，請使用：

c="([^"]+)" (\d+):(\d+) (\d+):(\d+)\|\|r="([^"]+)"\|\|c="([^"]+)" (\d+):(\d+) (\d+):(\d+)

https://regex101.com/r/qY9kG2/1

Python正則表達式從字符串中提取數據

問題描述

3 個解決方案

解決方案1
1 2015-06-19 09:49:11

解決方案2
0 2015-06-19 09:48:09

解決方案3
0 2015-06-19 09:49:30

Python正則表達式從字符串中提取數據

問題描述

3 個解決方案

解決方案1 1 2015-06-19 09:49:11

解決方案2 0 2015-06-19 09:48:09

解決方案3 0 2015-06-19 09:49:30

解決方案1
1 2015-06-19 09:49:11

解決方案2
0 2015-06-19 09:48:09

解決方案3
0 2015-06-19 09:49:30