繁体   English   中英

使用BeautifulSoup从网页上抓取javascript / json对象?

[英]Scraping a javascript / json object from a webpage using BeautifulSoup?

我正在使用BeautifulSoup来获取网页的HTML。 到目前为止,一切正常。 但是我真正想要的是HTML内的这个JavaScript块的内容,该内容用<script type="text/javascript">封装,然后在该标记内,最终有一个包含很多{}的巨型数组中括号,我相信这是一个JSON数组?

有没有办法我可以尝试从HTML中提取整个数组?

您正在寻找json.loads函数。

>>> import json
>>> obj = json.loads('{"a": 12, "b": null}')
>>> obj
{'b': None, 'a': 12}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM