簡體   English   中英

使用python從文本文件中提取單詞

[英]Extract words from text files with python

我有一個HTML文件,其中包含我無法使用BeautifulSoup輕松提取的內容,因為我認為它已加載了Javascript。

..."inlineParams":"json","title":"","lNameP":"MYNAME","key":"degree_result_person"},"firstName":"MYFIRSTNAME"...

我要提取此文件中的多個名稱。 這些名稱僅在“ lNameP”之后。 有什么辦法可以循環獲取所有這些名稱(在這種情況下,我想獲得MYNAME)?

非常感謝,

使用正則表達式?

import re
pattern = re.compile('\"(lNameP)\"\:\"(.*?)\"')
result = pattern.findall(string)

result[0][0]將是鍵,而result[0][1]將是值。

正則表達式代碼將完全符合您的需求:

string ='"inlineParams":"json","title":"","lNameP":"MYNAME","key":"degree_result_person"},"firstName":"MYFIRSTNAME"'
import re
pattern = re.compile('\"lNameP"\:"(.*?)"')
match = pattern.search(string).group(1)
print (match)

輸出:

MYNAME

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM