如何正则表达式的开头和结尾 - python

Question

我有一个包含日期、国家和城市的字符串列表：

myList = ["(1922, May, 22; USA; CHICAGO)","(1934, June, 15; USA; BOSTON)"]

我只想提取日期和城市（城市总是用大写字母）。 到目前为止，我有这个：

for info in myList:

        pattern_i = re.compile(r"[^;]+")
        pattern_f = re.compile(r";\s\b([A-Z]+)\)")

        mi = re.match(pattern_i, info)
        mf = re.match(pattern_f, info)

        print(mi)
        print(mf)

我正进入（状态：

<re.Match object; span=(0, 14), match='(1922, May, 22'>
None
<re.Match object; span=(0, 15), match='(1934, June, 15'>
None

我已经尝试了很多东西，但似乎无法找到解决方案。 我在这里想念什么？

Answer 1

正则表达式对于具有简单、一致格式的数据来说太过分了。 这可以使用内置的字符串操作函数轻松完成。

for entry in myList:
    date, country, city = [x.strip() for x in entry[1:-1].split(';')]

# Explanation
entry[1:-1] # Strip off the parenthesis
entry[1:-1].split(';') # Split into a list of strings using the ';' character
x.strip() # Strip extra whitespace

Answer 2

日期的正则表达式： ^\(([^;]+)

城市的正则表达式([AZ]+)\)$

Answer 3

您可以使用pandas ：

p='\((?P<date>.*);.*;(?P<city>.*)\)'

pd.Series(myList).str.extract(p)

Output：

             date      city
0   1922, May, 22   CHICAGO
1  1934, June, 15    BOSTON

Answer 4

 thanks, But I am still curious? why am I getting None for mf?
Python 基于正则表达式提供两种不同的原始操作：re.match() 仅在字符串的开头检查匹配，而 re.search() 在字符串中的任何位置检查匹配（这是 Perl 默认执行的操作）。Ref DOcs

re.match在字符串的开头搜索匹配，因为您尝试匹配的模式不在字符串的开头，所以您得到None您可以使用re.search是在任何地方查找匹配值的一种选择字符串

正如我建议 split 在这里是一个更好的选择，你应该拆分; 并取第一个和最后一个元素以获得所需的 output

如何正则表达式的开头和结尾 - python

问题描述

4 个解决方案

解决方案1
1 2019-10-22 16:40:57

解决方案2
0 2019-10-22 16:42:02

解决方案3
0 2019-10-22 16:43:29

解决方案4
0 已采纳 2019-10-22 16:51:21

如何正则表达式的开头和结尾 - python

问题描述

4 个解决方案

解决方案1 1 2019-10-22 16:40:57

解决方案2 0 2019-10-22 16:42:02

解决方案3 0 2019-10-22 16:43:29

解决方案4 0 已采纳 2019-10-22 16:51:21

解决方案1
1 2019-10-22 16:40:57

解决方案2
0 2019-10-22 16:42:02

解决方案3
0 2019-10-22 16:43:29

解决方案4
0 已采纳 2019-10-22 16:51:21