在python中使用方法startswith（）和re.findall（）提取确切的单词

Question

我有一个如下的文本文件，

&attri 'abc' real
&attri 'cde' real
&attri 'efg' {'0', '1'}
&attri 'ghi_jkl' real
&attri 'lmn' real
&attri 'nop' real
&attri 'pqr_stu_uvw' real
&attri 'xy_z' {'0', '1'}

我想从该文件中提取所有单词'abc', 'cde', 'efg', 'ghi_jkl', 'lmn', 'nop', 'pqr_stu_uvw', 'xy_z' 。

我编写了以下代码，但仅输出[] 。

import re

col = []

with open('text1.txt', 'r') as f:
    lines=f.readlines()
    for line in lines:
        l = line.strip()
        if l.startswith('&attri'):
            col.append(re.findall(r"'(.{1})'", l))
print(col)

谢谢您的帮助。

Answer 1

考虑到您始终需要从文件中提取每一行的第二个单词，因此在这里不需要正则表达式。 使用split()并提取第二个split：

col = []

with open('text1.txt', 'r') as f:
    for line in f:
        if line.strip().startswith('&attri'):
            col.append(line.split()[1].strip("'"))

print(col)

Answer 2

将2行替换为

       if l.startswith('&attri'):
            col.append(l.split()[1].strip("'"))

Answer 3

尝试这个：

import re

s = '''&attri 'abc' real
&attri 'cde' real
&attri 'efg' {'0', '1'}
&attri 'ghi_jkl' real
&attri 'lmn' real
&attri 'nop' real
&attri 'pqr_stu_uvw' real
&attri 'xy_z' {'0', '1'}'''


print(re.findall("'[a-zA-Z_]*'",s)

结果：

["'abc'", "'cde'", "'efg'", "'ghi_jkl'", "'lmn'", "'nop'", "'pqr_stu_uvw'", "'xy_z'"]

在python中使用方法startswith（）和re.findall（）提取确切的单词

问题描述

3 个解决方案

解决方案1
3 已采纳 2019-03-16 07:02:59

解决方案2
1 2019-03-16 07:06:54

解决方案3
0 2019-03-16 07:14:43

结果：

在python中使用方法startswith（）和re.findall（）提取确切的单词

问题描述

3 个解决方案

解决方案1 3 已采纳 2019-03-16 07:02:59

解决方案2 1 2019-03-16 07:06:54

解决方案3 0 2019-03-16 07:14:43

结果：

解决方案1
3 已采纳 2019-03-16 07:02:59

解决方案2
1 2019-03-16 07:06:54

解决方案3
0 2019-03-16 07:14:43