繁体   English   中英

如何使用python从.txt文件中提取段落?

[英]How to extract paragraphs from a .txt file using python?

我需要从 .txt 文件中提取段落,其中每个段落都以字母Abstract开头,如下所示。

摘要:大规模多输入多输出天线系统、毫米波通信和超密集网络已被广泛认为是促进 5G 系统开发和部署的三大关键推动因素。 我们提出了一个灵活、可快速部署且基于跨层人工智能 (AI) 的框架,以实现对 5G 及以后基础设施的迫在眉睫和未来的需求。 我们展示了支持 AI 的 5G 用例示例,这些用例可容纳重要的 5G 特定功能,并讨论 AI 在实现超越 5G 网络演进方面的价值。


摘要:无线革命已经以明确的愿景、总体目标和第 5 代 (5G) 无线网络的第一个官方 3GPP 版本开始。 尽管发展了几种现代通信技术,但自现代数字通信时代开始以来,我们主要通过改变正弦载波信号的幅度、相位或频率来传递信息,这具有固有的缺点。另一方面,索引调制 (IM) 为传输数字信息提供了另一种维度:相应通信系统构建块的索引。


摘要:安全是旨在利用蜂窝 (C) 服务将车辆连接到一切 (V2X) 的网络的主要关注点。 目前,C-V2X 正在观察从长期演进 (LTE) - 演进的通用陆地无线电接入网络 (E-UTRAN) 到基于第五代 (5G) 的功能架构的范式转变。 然而,安全和凭证管理仍然是 5G-V2X 下需要解决的问题。


我如何使用 python 脚本实现这一点?

我假设每个段落都由新行分隔。 如果是这样,您可以只使用splitlines()

with open("file", "r") as fd:
    lines = fd.read().splitlines()

如果需要,您可以删除“摘要:”,如下所示:

lines2 = [i[len("Abstract: ")] for i in lines]

像这样:

with open("./abstract.txt", "r") as f:
    for line in f:
        print(line)

这里发生了什么?

我们正在创建一个上下文管理器( with )来管理文件处理程序。 这可以防止在我们完成后让文件保持打开状态,以及其他令人头疼的问题。 我们将其分配给fas f “模式”是简单的阅读,参数open"r"

在那之后,我们的f是一个“类似文件”的对象,它是可迭代的,因此我们可以使用它执行诸如for循环和列表推导之类的列表操作。 每一行都是一个字符串,我们可以像您在@bunbun 的优秀答案中看到的那样对其进行字符串操作。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM