繁体   English   中英

JSOUP同时提取多个元素

[英]JSOUP extracting multiple elements in the same time

我想知道是否有任何方法可以从这样的代码中提取:

<div class="container  ">
                      <h2 class="job">
                          <a href="/work/android-developer/madrid/11537332" rel="nofollow" 
                          title="job Android Developer" class="job-offer ">
                              Android Developer
                          </a>
                      </h2>
                          <h3 class="company">
                                  <a href="/emp/nbc/133192">
                                      NBC Corp. 
                              </a>
                         </h3>
              </div>

文字Android developerNBC Corp.一枪吗?

类似于doc.select("h2,h3.p-job-title,p-name-company a[href]"); 不起作用。 我也尝试了doc.select("h2.p-job-title a[href], h3.p-name company a[href]");

请需要帮助!

编辑:我发现使用doc.select("h2.p-job-title + h3.p-name.company"); 我可以提取所需的内容,但是我需要的是一行中的h2内容+ h3内容,我的意思是“ Android Developer NBC Corp.”。 这样我得到:

“ Android开发人员”

“ NBC Corp.”

文字Android developerNBC Corp.合而为一?

尝试这个:

Elements es = doc.select("div.container"); 

for(Element e:es)
{
System.out.println(e.select("h2").text()+"\t"+e.select("h3").text()); 

 }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM