繁体   English   中英

在 Python 中使用 Beautifulsoup 进行网页抓取

[英]Webscraping Using Beautifulsoup in Python

我是 Python 中 Beautifulsoup 包的新手,在使用 .findAll() 函数时得到了一些意想不到的结果。 我需要从该网页的浅蓝色突出显示部分中立即提取 /File/ 右侧的字符串:

在此处输入图片说明

这是我的 Beautifulsoup/Python 代码:

在此处输入图片说明

前两行代码工作正常,但 pdf1 为空。 任何人都可以解释为什么 .findAll() 函数没有找到这个标签(我假设我犯了一个语法错误,只是不确定在哪里)?

您的屏幕截图显示了当前 HTML 的浏览器输出,我猜? 您是否检查了page.text内容是否相同? 这可能会揭示任何 BS 无法处理的客户端修改,如ngRepeat

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM