提取两个关键字之间可用的文本并将该文本存储到 python 中的列表中

Question

在我的文本文件中，我有以下内容：

fdsjhgjhg

fdshkjhk

开始

早上好

你好世界

结尾

破折号

天天快报

我应该怎么办我想提取单词“开始”和“结束”之间的可用文本并存储在list ？

Answer 1

这是一种方法：

text = '''fdshkjhk
Start
Good Morning
Hello World
End
dashjkhjk
'''
m = re.search(r"Start.*End", text, re.S)
if m is not None:
    print(m[0].split("\n")[1:-1])

下标[1:-1]从Start和End行剥离。

您还可以修改re以仅捕获两者之间的部分； 假设Start后面紧跟一个换行符，而End紧跟一个换行符：

m = re.search(r"Start\n(.*)\nEnd", text, re.S)
if m is not None:
    print(m[1].split("\n"))

这里我们使用m[1]来获取捕获的文本。

Answer 2

查看应该可以解决您的问题的答案。 a_text.txt文件包含您的文本数据。 为了测试目的，我又添加了两行。

ttp_template = """
Start {{ _start_ }}
{{line1 | _line_ }}
End {{ _end_ }}
"""

from ttp import ttp
import json

def text_parser(data_to_parse): 
    parser = ttp(data=data_to_parse, template=ttp_template)
    parser.parse()

    # print result in JSON format
    results = parser.result(format='json')[0]
    #print(results)

    #print(results)

    #converting str to json. 
    result = json.loads(results)

    return(result)

with open("a_text.txt") as f:
    data_to_parse = f.read()

print(text_parser(data_to_parse))

请看下面的output：

提取两个关键字之间可用的文本并将该文本存储到 python 中的列表中

问题描述

2 个解决方案

解决方案1
0 2022-10-29 19:48:57

解决方案2
0 2023-01-04 09:13:43

提取两个关键字之间可用的文本并将该文本存储到 python 中的列表中

问题描述

2 个解决方案

解决方案1 0 2022-10-29 19:48:57

解决方案2 0 2023-01-04 09:13:43

解决方案1
0 2022-10-29 19:48:57

解决方案2
0 2023-01-04 09:13:43