簡體   English   中英

如何在C#中獲取IDM Grabber這樣的特殊網站的文件和文件夾

[英]How Can I Get Files And Folders Of A Special Website Like IDM Grabber In C#

如果您使用過IDM(Internet下載管理器),則有一個名為Grabber的項目,可以在特殊的網站中搜索並獲取該網站的文件和文件夾,然后可以使用IDM下載它們。

我想在C#中做類似的事情。 我想下載HTML網頁並從這些網頁中提取鏈接。 我還想檢測目錄並嘗試搜索其內容-可能解析目錄列表頁面的“ Index Of”。

我將如何去做呢?

使用regex或使用HtmlAgilityPackhttp://htmlagilitypack.codeplex.com/ )來解析網站並找到文件的鏈接。 您可能需要檢查文件的擴展名。 IE瀏覽器。 僅解析以.zip|.exe|.msi|.rar|.png|.pdf|.gif|.jpg|.jpeg結尾的鏈接。

我曾經寫過一篇“ Web Spider”來做這件事,並在Code Project上發布了源代碼

如果您想以最終用戶的身份進行操作,我發現免費的Httrack網站復印機效果很好。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM