简体繁体 English

如何在Perl Web爬虫中处理Javascript？

[英]How can I handle Javascript in a Perl web crawler?

原文 2010-09-22 12:08:03 1 4 javascript/ perl/ web-crawler/ web-scraping

I would like to crawl a website, the problem is, that its full of JavaScript things, such as buttons and such that when they are pressed, they do not change the URL, but the data on the page is changed. 我想抓取一个网站，问题是，它充满了JavaScript的东西，比如按钮等，当按下它们时，它们不会改变URL，但页面上的数据会被更改。

Usually I use LWP / Mechanize etc to crawl sites, but neither support JavaScript. 通常我使用LWP / Mechanize等来抓取网站，但都不支持JavaScript。 any idea? 任何的想法？

4 个解决方案

The WWW::Scripter module has a JavaScript plugin that may be useful. WWW :: Scripter模块有一个可能有用的JavaScript插件。 Can't say I've used it myself, however. 但不能说我自己用过它。

另一种选择可能是Selenium与WWW :: Selenium模块

WWW::Mechanize::Firefox might be of use. WWW :: Mechanize :: Firefox可能会有用。 that way you can have Firefox handle the complex JavaScript issues and then extract the resultant html. 这样你就可以让Firefox处理复杂的JavaScript问题，然后提取生成的html。

I would suggest HtmlUnit and Perl wrapper: WWW::HtmlUnit . 我建议使用HtmlUnit和Perl包装器： WWW :: HtmlUnit 。

在Perl中使用JavaScript支持的Web Crawler？ - Web Crawler with JavaScript support in Perl?

如何使用Perl访问JavaScript驱动的网页的内容？ - How can I access the contents of a JavaScript driven web page with Perl?

Web爬虫：使用Perl的MozRepl模块来处理Javascript - Web crawler: Using Perl's MozRepl module to deal with Javascript

如何在Selenium的Javascript Web驱动程序中处理警报？ - How Can I Handle Alerts In Selenium's Javascript Web Driver?

带有Ajax / JavaScript的Web爬网程序 - Web Crawler with Ajax/JavaScript

Web搜寻器遇到JavaScript - Web crawler encounter javascript

Javascript 异步 web 爬虫 - Javascript asynchronous web crawler

如何使用Perl从使用JavaScript动态生成的网页中获取文本？ - How can I use Perl to grab text from a web page that is dynamically generated with JavaScript?

如何在Perl中打开JavaScript对象？ - How can I open a javascript object in Perl?

具有网址的javascript数组的网络搜寻器？ - Web crawler with javascript array of URLs?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Perl中使用JavaScript支持的Web Crawler？ - Web Crawler with JavaScript support in Perl? 如何使用Perl访问JavaScript驱动的网页的内容？ - How can I access the contents of a JavaScript driven web page with Perl? Web爬虫：使用Perl的MozRepl模块来处理Javascript - Web crawler: Using Perl's MozRepl module to deal with Javascript 如何在Selenium的Javascript Web驱动程序中处理警报？ - How Can I Handle Alerts In Selenium's Javascript Web Driver? 带有Ajax / JavaScript的Web爬网程序 - Web Crawler with Ajax/JavaScript Web搜寻器遇到JavaScript - Web crawler encounter javascript Javascript 异步 web 爬虫 - Javascript asynchronous web crawler 如何使用Perl从使用JavaScript动态生成的网页中获取文本？ - How can I use Perl to grab text from a web page that is dynamically generated with JavaScript? 如何在Perl中打开JavaScript对象？ - How can I open a javascript object in Perl? 具有网址的javascript数组的网络搜寻器？ - Web crawler with javascript array of URLs?

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM