[英]BeautifulSoup can't find a tag by its class
以下是网页的一部分:
<div class="MPinfo">
<ul class="frontList">
<li>some text</li>
<li>some text</li>
<li>some text</li>
<li>some text</li>
<li>some text</li>
<li>some text
<a href="/some_local_link/8976">some text</a>;
<a href="/some_local_link/8943">some text</a>;
</li>
<li>E-mail:
<a href="mailto:Ss.Sssssss@mail.com">Ss.Sssssss@mail.com</a>
</li>
</ul>
</div>
我试图通过它的类获取div然后将电子邮件链接提取到电子邮件本身,如:Ss.Sssssss@mail.com
page = urllib.urlopen(link)
soup = BeautifulSoup(page.read())
print soup.find('div', attrs={'class': 'MPinfo'})
我已经尝试了几种获取div的方法,但它返回空列表或None
您可以在div下选择所有li,它将是一个列表,因此您可以选择最后一个li元素,如[-1]
>>> soup.find("div",attrs={"class":"MPinfo"}).find_all("li")[-1].a.text
'Ss.Sssssss@mail.com'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.