[英]Select element based on text inside Beautiful Soup
我报废了一个网站,但我想根据其中的文字查找一个元素。 假设以下是该网站的示例代码:
code = bs4.BeautifulSoup("""<div>
<h1>Some information</h1>
<p>Spam</p>
<p>Some Information</p>
<p>More Spam</p>
</div>""")
我想要某种方式来获取具有文本值Some Information
的p元素。 如何选择这样的元素?
只需使用text
参数:
code.find_all("p", text="Some Information")
如果只需要第一个元素,则使用find
而不是find_all
。
您可以使用text
搜索与字符串匹配的所有标签
import BeautifulSoup as bs
import re
code = bs.BeautifulSoup("""<div>
<h1>Some information</h1>
<p>Spam</p>
<p>Some Information</p>
<p>More Spam</p>
</div>""")
for elem in code(text='Some Information'):
print elem.parent
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.