繁体   English   中英

Python-重新格式化文本文件,从零碎的句子中创建完整的句子

[英]Python- reformat text file, create full sentences from fragmented sentences

Python 问题,因为这是我知道的唯一语言。
我有许多非常长的文本文件(8,000 多行),其中的句子被分割成多行,即

研究双方,然后你应该
制定自己的答案。 这很简单,
直截了当的建议,这是常识。
在疫苗接种方面,气候
变化,以及新型冠状病毒 SARS-CoV-2
等等

我需要将这些片段连接成完整的句子,在句号(句号)问号、引用的句号等处打破它们。并将它们写入一个新的清理文本文件,但我不确定 go 关于它的最佳方法。
我尝试循环,但结果表明这种方法行不通。

我以前从未编写过生成器(不确定在这种情况下是否需要这样做),因为我是一名业余开发人员,并且使用编码来使我的生活更轻松并解决问题。 任何帮助将不胜感激。

如果您将文件读入变量f ,那么您可以一次访问一行文本(因为f类似于字符串列表)。 可能对您有帮助的函数是String.joinString.split Join 将获取一个字符串列表,并在它们之间用一个字符串连接它们。 'z'.join["a", "b", "c"]将产生 "azbzc"。 Split 将一个字符串作为参数,找到该字符串的每个实例,并将其拆分。 "azbzc".split('z')将再次产生["a", "b", "c"] 在每一行之后删除换行符,然后用空格之类的东西将它们连接起来会将文本重新构建为单个字符串,然后在问号等内容上使用 split 将按照您想要的方式拆分它。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM