[英]Web Scraping problem, getting empty list back with BeautifulSoup Library
我对网络抓取很陌生。 我试图通过他们的网址从他们的 mubi 网站的源代码中抓取电影列表的类型。 在这里,我在下图所示的源代码中找到了类名为“css-1wuve65 eyplj6810”的流派:
并使用以下代码,我试图通过“选择”来获取这种类型:“”
for i in range(len(movie_url.movie_url)):
url = movie_url.movie_url[i]
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html,'html.parser')
gener_tags = soup.select('div.css-1wuve65 eyplj6810')
print(gener_tags)
但是我不断将空列表返回到每个流派标签。 我检查了 url,它被正确检索。 有人可以帮助或给我一些有关如何执行此操作的提示吗? 示例网址是
https://mubi.com/films/elementary-particles
您在div.css-1wuve65
和eyplj6810
之间缺少一个点 ( .
):
import requests
from bs4 import BeautifulSoup
url = 'https://mubi.com/films/elementary-particles'
soup = BeautifulSoup(requests.get(url).content, 'html.parser')
print(soup.select_one('div.css-1wuve65.eyplj6810').text)
印刷:
Comedy, Drama, Romance, Cult
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.