繁体   English   中英

如何从IMDB网站上抓取电影信息?

[英]How to scrape movies information from the IMDB website?

我是Python的新手,正在尝试抓取IMDB。 我正在抓取250部IMDB顶级电影的清单,并希望获得每个唯一网站上的信息,例如每个电影的长度。

我已经有一个唯一URL列表。 因此,我想遍历此列表,并针对该列表中的每个URL检索该电影的“长度”。 这可以用一个代码完成吗?

for URL in urlofmovie:
    htmlsource = requests.get(URL)
    tree_url = html.fromstring(htmlsource)
    lengthofmovie = tree_url.xpath('//*[@class="subtext"]')

我希望lengthofmovie会成为所有电影长度的清单。 但是,它在第​​2行: htmlsource已经出错。

要使其成为列表,您应该首先创建一个列表,然后将每个长度附加到该列表中。

length_list = []
for URL in urlofmovie:
    htmlsource = requests.get(URL)
    tree_url = html.fromstring(htmlsource)
    length_list.append(tree_url.xpath('//*[@class="subtext"]'))

小提示 :由于您是Python的新手,所以建议您使用PEP8约定 您的变量命名可以使您(和其他开发人员)的生活更轻松。 (urlofmovie-> urls_of_movies)

但是,对于第2行:htmlsource,它已经出错了。

请提供您收到的例外情况。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM