繁体   English   中英

如何使用Jsoup从网页中提取多个电子邮件地址?

[英]How to extract multiple email addresses from a web page using Jsoup?

我有一些站点列表,我需要从这些站点转到联系页面并使用jsoup提取每个站点的电子邮件ID。 我正在使用java.util.regex.Pattern获取电子邮件ID代码,如下所示

Matcher m = Pattern.compile("[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\\.[a-zA-Z0-9-.]+").matcher(doc.toString());
if (m.find()) {             
 email= m.group();              
 System.out.println(email);
}

我遇到了一个网站,其中包含多个电子邮件地址,但是上面的代码仅获得一个电子邮件ID,这是第一个遇到的。 我想从该页面获取所有电子邮件ID。

我尝试使用下面的代码,但仍然收到所有垃圾

Elements elements =  doc.getElementsMatchingText(Pattern.compile("[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\\.[a-zA-Z0-9-.]+"));
for(Element element: elements){
System.out.println(element.toString());
}

如何从网页获取所有电子邮件ID? 请帮我。

您需要使用while循环而不是if条件,以便它将为每个匹配项进行打印。

while (m.find()) {             
 email= m.group();              
 System.out.println(email);
}

要么

while (m.find()) {                         
     System.out.println(m.group());
    }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM