簡體   English   中英

Python-重新格式化文本文件,從零碎的句子中創建完整的句子

[英]Python- reformat text file, create full sentences from fragmented sentences

Python 問題,因為這是我知道的唯一語言。
我有許多非常長的文本文件(8,000 多行),其中的句子被分割成多行,即

研究雙方,然后你應該
制定自己的答案。 這很簡單,
直截了當的建議,這是常識。
在疫苗接種方面,氣候
變化,以及新型冠狀病毒 SARS-CoV-2
等等

我需要將這些片段連接成完整的句子,在句號(句號)問號、引用的句號等處打破它們。並將它們寫入一個新的清理文本文件,但我不確定 go 關於它的最佳方法。
我嘗試循環,但結果表明這種方法行不通。

我以前從未編寫過生成器(不確定在這種情況下是否需要這樣做),因為我是一名業余開發人員,並且使用編碼來使我的生活更輕松並解決問題。 任何幫助將不勝感激。

如果您將文件讀入變量f ,那么您可以一次訪問一行文本(因為f類似於字符串列表)。 可能對您有幫助的函數是String.joinString.split Join 將獲取一個字符串列表,並在它們之間用一個字符串連接它們。 'z'.join["a", "b", "c"]將產生 "azbzc"。 Split 將一個字符串作為參數,找到該字符串的每個實例,並將其拆分。 "azbzc".split('z')將再次產生["a", "b", "c"] 在每一行之后刪除換行符,然后用空格之類的東西將它們連接起來會將文本重新構建為單個字符串,然后在問號等內容上使用 split 將按照您想要的方式拆分它。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM