繁体 English 中英

如何使用scrapy或selenium刮动态页面？

[英]How to scrape a dynamic page using scrapy or selenium?

原文 2019-06-13 09:02:57 7 1 javascript/ python/ html/ parsing/ screen-scraping

我试图刮一个网页动态页面但是scrapy ，我没有检索所有信息，因为我想要的信息是动态的。

我尝试使用Selenium但不像Scrapy，你不能指定标题，网站阻止我。 （我无法为网站命名，因为抓取是非法的，但它是一个着名的旅行元搜索引擎......）。 我有一个带有验证码解算器的页面（重新验证码很难用脚本解决）因为网站检测到我是机器人。

我希望拥有所有动态信息并可以访问该网站，但是selenium和scrapy不可能不能提供我想要的所有信息，我认为这是因为当scrapy读取它时页面没有完全加载。

1 个解决方案

你可以使用硒和美味的汤，你可以刮掉所有的数据。 请按照这样的方式。 https://code.tutsplus.com/tutorials/modern-web-scraping-with-beautifulsoup-and-selenium--cms-30486 。

如何抓取动态网站-使用python scrapy？

[英]How to scrape dynamic website - using python scrapy?

使用 scrapy 抓取数据的动态网页

[英]Scrape dynamic webpage for data using scrapy

跟随页面的每个链接并抓取内容，Scrapy + Selenium

[英]Follow each link of a page and scrape content, Scrapy + Selenium

如何使用PHP从动态网页中抓取页面链接？

[英]How to scrape page links from dynamic web page using PHP?

如何使用 python 和 selenium 和漂亮的汤抓取弹出页面

[英]How to Scrape a popup page using python and selenium and beautiful soup

scrapy 可以用来从使用 AJAX 的网站上抓取动态内容吗？

[英]Can scrapy be used to scrape dynamic content from websites that are using AJAX?

如何抓取页面的动态 URL？

[英]How do I scrape dynamic URL of a page?

无论使用scrapy包含哪些标签，如何刮取特定文本

[英]How to scrape a certain text regardless of which tags it is contained in using scrapy

如何使用 Scrapy 和 Splash 抓取基于 AJAX 的网站？

[英]How to scrape AJAX based websites by using Scrapy and Splash?

如何使用 Scrapy 从网站抓取 JavaScript 呈现的数据？

[英]How to scrape JavaScript rendered data from a website using Scrapy?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何抓取动态网站-使用python scrapy？使用 scrapy 抓取数据的动态网页跟随页面的每个链接并抓取内容，Scrapy + Selenium 如何使用PHP从动态网页中抓取页面链接？如何使用 python 和 selenium 和漂亮的汤抓取弹出页面 scrapy 可以用来从使用 AJAX 的网站上抓取动态内容吗？如何抓取页面的动态 URL？无论使用scrapy包含哪些标签，如何刮取特定文本如何使用 Scrapy 和 Splash 抓取基于 AJAX 的网站？如何使用 Scrapy 从网站抓取 JavaScript 呈现的数据？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM