使用python从文本文件中提取单词

Question

我有一个HTML文件，其中包含我无法使用BeautifulSoup轻松提取的内容，因为我认为它已加载了Javascript。

..."inlineParams":"json","title":"","lNameP":"MYNAME","key":"degree_result_person"},"firstName":"MYFIRSTNAME"...

我要提取此文件中的多个名称。 这些名称仅在“ lNameP”之后。 有什么办法可以循环获取所有这些名称（在这种情况下，我想获得MYNAME）？

非常感谢，

Answer 1

使用正则表达式？

import re
pattern = re.compile('\"(lNameP)\"\:\"(.*?)\"')
result = pattern.findall(string)

result[0][0]将是键，而result[0][1]将是值。

Answer 2

此正则表达式代码将完全符合您的需求：

string ='"inlineParams":"json","title":"","lNameP":"MYNAME","key":"degree_result_person"},"firstName":"MYFIRSTNAME"'
import re
pattern = re.compile('\"lNameP"\:"(.*?)"')
match = pattern.search(string).group(1)
print (match)

输出：

MYNAME

使用python从文本文件中提取单词

问题描述

2 个解决方案

解决方案1
0 2015-09-04 10:12:57

解决方案2
0 已采纳 2015-09-04 10:42:21

使用python从文本文件中提取单词

问题描述

2 个解决方案

解决方案1 0 2015-09-04 10:12:57

解决方案2 0 已采纳 2015-09-04 10:42:21

解决方案1
0 2015-09-04 10:12:57

解决方案2
0 已采纳 2015-09-04 10:42:21