繁体 English 中英

如何使用BeautifulSoup遍历网站的每个页面以进行网页抓取

[英]How to loop through each page of website for web scraping with BeautifulSoup

原文 2017-09-20 23:04:25 1 1 python/ html/ web-scraping/ beautifulsoup

我正在使用BeautifulSoup从网站抓取职位发布数据。 我有满足我需要的工作代码，但它只会刮取职位发布的第一页。 我在弄清楚如何迭代更新URL以刮擦每个页面时遇到了麻烦。 我是Python的新手，曾经研究过几种解决类似问题的方法，但是还没有弄清楚如何将其应用于我的特定网址。 我认为我需要迭代更新URL或以某种方式单击“下一步”按钮，然后在每个页面中循环我现有的代码。 我感谢任何解决方案。

网址： https ： //jobs.utcaerospacesystems.com/search-jobs

1 个解决方案

首先，BeautifulSoup与获取网页没有任何关系-您可以自己获取网页，然后将其提供给bs4进行处理。

您链接的页面的问题在于它是javascript-仅在浏览器（或任何其他javascript VM）中正确显示。

@Fabricator处在正确的轨道上-您需要观察开发人员控制台，并查看ajax请求js将其发送到服务器的内容。 在这种情况下，还要看一下查询字符串参数，其中包括一个称为CurrentPage的参数-可能是您要关注的参数。

如何使用BeautifulSoup遍历URL列表进行Web抓取

[英]How to loop through a list of urls for web scraping with BeautifulSoup

使用BeautifulSoup进行Python网络抓取，如何循环访问复杂的URL？

[英]Python web scraping using BeautifulSoup, how to loop through complicated URL?

如何使用 BeautifulSoup 循环浏览网站？

[英]How to loop through website with BeautifulSoup?

如何遍历嵌套网页进行网页抓取？

[英]How to loop through a nested web page for web scraping?

Web 刮过多个页面并没有保存每个结果-beautifulsoup

[英]Web scraping through multiple pages doesnt save each result -beautifulsoup

如何使用BeautifulSoup遍历在多个网页上抓取多个文档？

[英]How to loop through scraping multiple documents on multiple web pages using BeautifulSoup?

通过Python BeautifulSoup进行网页爬取

[英]Web Scraping through Python BeautifulSoup

通过BeautifulSoup分页进行网页抓取

[英]Web scraping through pagination with BeautifulSoup

如何进行网页抓取-beautifulSoup

[英]how to web scraping - beautifulSoup

如何遍历 BeautifulSoup Web Scraping 的 URL 列表？

[英]How to iterate through a list of URLs for BeautifulSoup Web Scraping?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用BeautifulSoup遍历URL列表进行Web抓取使用BeautifulSoup进行Python网络抓取，如何循环访问复杂的URL？如何使用 BeautifulSoup 循环浏览网站？如何遍历嵌套网页进行网页抓取？ Web 刮过多个页面并没有保存每个结果-beautifulsoup 如何使用BeautifulSoup遍历在多个网页上抓取多个文档？通过Python BeautifulSoup进行网页爬取通过BeautifulSoup分页进行网页抓取如何进行网页抓取-beautifulSoup 如何遍历 BeautifulSoup Web Scraping 的 URL 列表？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM