繁体   English   中英

刮除具有多个链接的页面的一般方法

[英]General approach for scraping pages with multiple links on them

Tampermonkey菜鸟在这里。 因此,我用tampermonkey编写了一个脚本,该脚本在包含链接的表的页面上查找表元素,并从中获取所有href,并将其放入数组中。

我实际上需要进入这些链接并获取一些数据,然后返回到表格页面,并进入下一个链接,依此类推,重复直到最后一个链接。 我不知道该怎么实现,因为当它从第一个链接返回到链接表页面时,脚本将重置并再次进入第一个链接。

谢谢,

编辑:

var urls= [];
for (var i= document.links.length; i-->0;){
if (document.links[i].hostname===location.hostname){
    urls.push(document.links[i].href);
}
}    

我想进入链接并打开每个链接并从中获取数据并返回,然后继续下一个链接,重复。

我不确定您要的是什么,但是也许您需要使用一个循环? 可以编辑您的问题以提供源代码吗?

我认为,您要解决的问题是针对数组中的每个链接(我假设您有一个链接数组),发出请求(也许使用jQuery的$ .get / $。post或类似方法...),然后对响应做一些事情。

如果要对响应进行某些操作,请将其推入数组,然后在完成FOR循环后,对该数组进行操作。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM