簡體   English   中英

如何從內嵌JavaScript抓取網址

[英]How do I go about scraping a url from inline javascript

這重復了240次,每當最后一組的兩組數字都是不同的數字時,我想要所有URL的列表。

所以我想我需要找到每個腳本,然后在每個腳本中找到第一個“ commtArr”,並假設它始終是第一個。

我什至從哪里開始?

<script type="text/javascript">
            commArr[commArr.length] = "http://example.com/index.php?option==down&pid=123&id=389";
            commtArr[commtArr.length] = "mp3";
            commnArr[commnArr.length] = "john doe.mp3";
</script">

該URL實際上是插入到commArr中 ,而不是commtArr中 。看來commArr將永遠只有該URL。

假設腳本在同一頁面上重復了X次,則剩下的變量已經包含所有URL。 這只是列出它的簡單情況。

for (i = 0; i < commArr.length; i++) { console.log(commArr[i]) } 

如果它在各個頁面上,則可能需要某種蜘蛛機器人腳本才能轉到所有頁面,運行一個可捕獲commArr並永久保存的腳本。 恐怕除了手動操作外,我什么也不能建議。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM