簡體   English   中英

如何 WEB 抓取 XML 站點地圖

[英]how to WEB SCRAPE XML SITEMAP

我試圖弄清楚是否可以抓取網站的站點地圖,並且每次站點地圖發生更改時,記錄/記錄更改的內容並將其發送到電子郵件地址或電報帳戶。

有誰知道這是否可行,如果可以,從哪里開始?

謝謝

我假設您已經抓取了站點地圖。

對的,這是可能的。 您需要安排在定期間隔后自動觸發的任務。

在此任務中,您需要讀取網站的站點地圖並將所有 URL 保存在數據庫中。 您必須添加 URL 是否已經在數據庫中的條件。 如果 URL 是新的並且在數據庫中不可用,那么您將將該 URL 發送到電子郵件/電報並將該 URL 添加到數據庫中。

每次調度程序任務運行時,它都會找到所有新的 URL,並將通過電子郵件發送給您並更新數據庫。 希望這是有幫助的。

如果您還沒有抓取站點地圖。 你可以通過 JSOUP/Scrapy 來做到這一點。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM