繁体   English   中英

Jsoup选择器“不”

[英]Jsoup Selector “not”

这段代码在这里:

Document doc = Jsoup.connect("http://wikitravel.org/en/San_Francisco").get();
System.out.println(doc.select("h2:contains(Get around) ~ *:not(h2:contains(See) ~ *)"));

输出http://pastebin.com/gkcCfr1F 是否有一个选择器将“ not”选择器包括在内? 现在,当我想删除带有id =“ see”的最后一个h2标签以及其他所有内容时,它正在删除“ see”之后的所有内容,因为我正尝试解析Wiki的各个部分。

我想要获得的最终输出是: http : //pastebin.com/ntpVrgui

我会做这样的事情:

获取内容div:

 StringBuilder sb = new StringBuilder();
    boolean start = false;
    Document doc = Jsoup.connect("http://wikitravel.org/en/San_Francisco").get();
            Elements content = doc.select("#content");
            for (Element element : content) {
                /*Pseudo code
                   if element is h3 and it contains span with id Navigating and if start is  
false append it to stringbuilder, set start to true, else append everything in between until you reach h2 with span id See
                  */                
    }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM