繁体   English   中英

不一致的结果美丽的汤?

[英]Inconsistent results beautiful soup?

所以,我正在抓取一个网站,虽然我能够返回网页的 html,但漂亮的“查找”结果却不一致。 在一遍又一遍地运行检索同一页面时,BS4 有时可以找到某个标签,有时则不能。

我测试了网页 len,当 Beautiful Soup 能够检索到想要的标签时,len 是 9220189(正确的尺寸),如果不能,则是 103557968。我用两种尺寸打印了网页,它们是一致的。 事实上,我正在寻找的字符串可以在两个网页打印中找到。

这可能是美汤的大小限制吗? 我不确定发生了什么?

编辑:链接: https : //www.brenda-enzymes.org/ligand.php?brenda_ligand_id=1

我在找什么:soup.find(string='Molecular Formula')

有时可以找到字符串,有时则不能。 文本始终在网页中,并且未加载 javascript。

我已经通过减小 html 的大小解决了这个问题。 虽然我没有找到更好的解决方案,但必须这样做。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM