如何解析包含特定單詞的行？

Question

我讓我的 python 代碼通過一個 HTML 文檔，當它這樣做時，我需要它來查找特定的單詞，然后解析具有以下單詞的行

例如

如果 HTML 文檔看起來像這樣

htmlDocument = '''
word 023-213103-2402131025901238923213

bla bla bla

bla bla bla 

word 2512-521-096-07464325

bla bla bla 

bla bla bla 

word 123123-0293231
'''

解析后我需要我的 desiredList 看起來像這樣

desirableList = [
"word 023-213103-2402131025901238923213",
"word 2512-521-096-07464325",
"word 123123-0293231"
]

Answer 1

這是一種方法：

>>> desirableList  = [s for s in htmlDocument.split("\n") if "word" in s]
>>> desirableList
['word 023-213103-2402131025901238923213', 'word 2512-521-096-07464325', 'word 123123-0293231']

根據需要更新條件以獲得其他類型的結果，例如“行開頭為”：

[s for s in htmlDocument.split("\n") if s.startswith("word")]

如何解析包含特定單詞的行？

問題描述

1 個解決方案

解決方案1
1 已采納 2019-12-15 06:48:58

如何解析包含特定單詞的行？

問題描述

1 個解決方案

解決方案1 1 已采納 2019-12-15 06:48:58

解決方案1
1 已采納 2019-12-15 06:48:58