[英]BeautifulSoup How to find only tags containing the tag?
我解析的页面的html代码有一部分:
<td>
<a class="soup" href="link">1</a>
</td>
<td>
<a class="soup" href="link">2</a>
<br>
<img src="/any.gif">
</br>
</td>
<td>
<a class="soup" href="link">3</a>
</td>
<td>
<a class="soup" href="link">4</a>
<br>
<img src="/any.gif">
</br>
</td>
<td>
<a class="soup" href="link">5</a>
</td>
问题:如何仅获取所有包含br和img的td?
UPD:我尝试使用soup.find('img', {'src': '/any.gif'}).findPreviousSibling('a')
但他只找到一个<a>
(主要目标是获得全部仅<a>
在他们旁边<br><img></br>
)
对您的代码进行很小的改进
for img in soup.find_all('img', {'src': '/any.gif'}):
if img.findPreviousSibling('a') is not None:
a=img.findPreviousSibling('a')
print a['href']
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.