[英]Select div -class tag using Jsoup with Java
我想用Jsoup選擇<div class="article_text">some long text </div>
。
String url = "computerworld.bg/45781_sofiya_teh_park_tryabva_da_bade_zavarshen_do_kraya_na_2015_g";
Document document = Jsoup.parse(new URL(url).openStream(), "ISO-8859-1", url);
Elements elements = document.select("div.article_text");
然后,我想遍歷元素並獲取theri文本。 但是沒有選擇div。 如果我只嘗試使用div作為css選擇器,則會顯示正確的文本信息,但是還有另一個不合適的divs文本,因此我必須使用類名。
我哪里錯了?
該文檔顯然表示還可以。
Element masthead = doc.select("div.masthead").first(); // div with class=masthead
因此,我認為_
引起了問題。 嘗試使用div[class=article_text]
作為選擇器,如果該方法不起作用,則使用div[class^=article]
(類以article開頭),但是它可以選擇比您想要的更多的內容。
更新
div.article_text
可在在線Jsoup測試器( http://try.jsoup.org/ )上使用您代碼中的網址進行工作。 也許問題在於您如何獲取文檔。 本示例使用Jsoup.connect()
Document doc = Jsoup.connect("http://www.computerworld.bg/45781_sofiya_teh_park_tryabva_da_bade_zavarshen_do_kraya_na_2015_g").get();
更新2
事實證明,這個特定的url根據用戶代理返回不同的內容(未設置用戶代理,該div上不存在article_text
),因此只需將userAgent
設置為Mozilla
。
Jsoup.connect("http://www.computerworld.bg/45781_sofiya_teh_park_tryabva_da_bade_zavarshen_do_kraya_na_2015_g").userAgent("Mozilla").get();
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.