使用python從文本文件中提取單詞

Question

我有一個HTML文件，其中包含我無法使用BeautifulSoup輕松提取的內容，因為我認為它已加載了Javascript。

..."inlineParams":"json","title":"","lNameP":"MYNAME","key":"degree_result_person"},"firstName":"MYFIRSTNAME"...

我要提取此文件中的多個名稱。 這些名稱僅在“ lNameP”之后。 有什么辦法可以循環獲取所有這些名稱（在這種情況下，我想獲得MYNAME）？

非常感謝，

Answer 1

使用正則表達式？

import re
pattern = re.compile('\"(lNameP)\"\:\"(.*?)\"')
result = pattern.findall(string)

result[0][0]將是鍵，而result[0][1]將是值。

Answer 2

此正則表達式代碼將完全符合您的需求：

string ='"inlineParams":"json","title":"","lNameP":"MYNAME","key":"degree_result_person"},"firstName":"MYFIRSTNAME"'
import re
pattern = re.compile('\"lNameP"\:"(.*?)"')
match = pattern.search(string).group(1)
print (match)

輸出：

MYNAME

使用python從文本文件中提取單詞

問題描述

2 個解決方案

解決方案1
0 2015-09-04 10:12:57

解決方案2
0 已采納 2015-09-04 10:42:21

使用python從文本文件中提取單詞

問題描述

2 個解決方案

解決方案1 0 2015-09-04 10:12:57

解決方案2 0 已采納 2015-09-04 10:42:21

解決方案1
0 2015-09-04 10:12:57

解決方案2
0 已采納 2015-09-04 10:42:21