[英]Java/Jsoup - HTML element's ID changes with each refesh
我有一段代碼,可用來使用Jsoup庫從各種網站上抓取數據。
Connection conn = Jsoup.connect(url);
try {
doc = conn.get();
Element element = doc.getElementById(elementId);
System.out.println(element.html());
} catch (IOException e) {
e.printStackTrace();
}
該代碼在大多數網站上都可以正常運行,但是我注意到,對於我要從其中抓取的一個網站,此代碼無法正常工作,因為感興趣的HTML元素的ID隨頁面的每次刷新而變化,這似乎是在ID的末尾附加一個隨機數。
是否故意這樣做是為了防止人們抓取數據? 如果是這樣,解決該問題的最佳方法(如果有)是什么?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.