[英]Can't read Outlook mail with JavaMail, while Gmail works
基本上,我写了一个从收件箱中读取电子邮件的应用程序。 我一直在用Gmail发送的电子邮件测试应用程序。 但是现在当我试图阅读从Outlook发送的电子邮件时,我没有收到任何内容。
我从两封电子邮件中记录了内容类型:Gmail返回: multipart/alternative; boundary=047d7b342bf2b6847f04d11df78a
multipart/alternative; boundary=047d7b342bf2b6847f04d11df78a
Outlook返回: text/html; charset=iso-8859-1
text/html; charset=iso-8859-1
注意:这些是相同的电子邮件,只是从不同的邮件客户端发送的。
来自Gmail的邮件将是Multipart的一个实例。 而Outlook电子邮件将是String的一个实例。
我的代码:
检查消息是否为Multipart或String的实例的方法。
public void getContent(Message msg) throws IOException, Exception {
Object contt = msg.getContent();
System.out.println("Contenttype: " + msg.getContentType());
if (contt instanceof Multipart) {
checkDisposition = true;
handleMultipart((Multipart) contt);
} else if (contt instanceof String) {
handlePart((Part) msg);
}
prepareEmail(mpMessage);
}
如果消息是multipart,则将调用此方法:
public void handleMultipart(Multipart multipart)
throws MessagingException, IOException, Exception {
mpMessage = getText(multipart.getBodyPart(0));
for (int z = 1, n = multipart.getCount(); z < n; z++) {
handlePart(multipart.getBodyPart(z));
}
}
如果消息不是,则直接调用:
public void handlePart(Part part)
throws MessagingException, IOException, Exception {
Object con = messageCopy.getContent();
String disposition = part.getDisposition();
String contentType = part.getContentType();
if (checkDisposition) {
if (disposition == null) {
System.out.println("Disposition is null");
} else if (disposition.equalsIgnoreCase(Part.ATTACHMENT)) {
System.out.println("Attachment: " + part.getFileName()
+ " : " + contentType);
input = part.getInputStream();
bytes = IOUtils.toByteArray(input);
} else if (disposition.equalsIgnoreCase(Part.INLINE)) {
System.out.println("Inline: "
+ part.getFileName()
+ " : " + contentType);
} else {
System.out.println("Other: " + disposition);
}
}else{
mpMessage = part.getContent().toString(); //returns nothing
System.out.println("mpMessage handlePart "+mpMessage); //returns nothing
System.out.println("mpMessage handlePart "+part.getLineCount()); //returns 0
System.out.println("mpMessage handlePart "+part.getContentType()); //returns text/html chartset=iso-8859-1
System.out.println("mpMessage handlePart "+part.getSize()); // returns 22334
part.writeTo(System.out); //See below
}
}
从部件返回文本的方法:
private String getText(Part p) throws
MessagingException, IOException {
System.out.println("getText contentType "+p.getContentType());
//This part gets called if trying to read an Outlook mail, its not clear for me how to retrieve the text from the part. Since `p.getContent()` returns nothing
if (p.isMimeType("text/*")) {
String s = (String) p.getContent();
System.out.println();
return String.valueOf(s);
}
if (p.isMimeType("multipart/alternative")) {
Multipart mp = (Multipart) p.getContent();
String text = null;
for (int i = 0; i < mp.getCount(); i++) {
Part bp = mp.getBodyPart(i);
if (bp.isMimeType("text/plain")) {
String s = getText(bp);
if (s != null) {
return s;
}
}
}
return text;
}
return null;
}
part.writeTo(System.out)
返回:
收到:来自AMSPRD0710HT005.eurprd07.prod.outlook.com Server(TLS)id 00000; 星期四,2012年12月20日09:28:23 +0000收到:来自AMSPRD0710MB354.eurprd07.prod.outlook.com([00.000.0000])AMSPRD0710HT005.eurprd07.prod.outlook.com([00.000.0000])with mapi id 14.16.0245.002; 星期四,2012年12月20日09:28:05 +0000来自:测试至:支持主题:Verwerkingsverslag Kenmerk:0824496主题 - 主题:Verwerkingsverslag Kenmerk:0824496主题索引:Ac3elFC2qYsSo + SOT2ii4HnbCCqgVw ==日期:星期四,2012年12月20日10: 28:05 +0100消息ID:...
等等。
消息本身的内容将作为HTML代码返回,而不仅仅是普通文本。
如何从Outlook电子邮件中检索纯文本,而不是HTML代码? 或者如何在handlePart中检索部件的内容?
任何帮助表示赞赏,
谢谢!
您似乎假设Outlook使用HTML版本发送纯文本,但似乎并非如此。 您从Outlook记录的电子邮件的MIME类型是text/html
,表示它只是一个HTML格式的文档。 另一方面,Gmail版本发送了一个multipart/alternative
文档,这可能表明同一文档中有多个版本的电子邮件(纯文本和HTML - 我相信这是Gmail的默认行为)。 因此,如果您获得HTML编码版本,您将收到电子邮件的“文本”,就像它发送一样。
不要求使用纯文本版本或实际上使用任何其他格式发送电子邮件。 您可以确保邮件客户端以您的消费程序可以处理的格式发送电子邮件,或者更改消费程序以处理正在发送的格式。
除上述内容外,您可能还想重新考虑以下内容:
mpMessage = getText(multipart.getBodyPart(0));
这似乎假设多部分消息的第一部分将是纯文本文档和消息的文本。 这可能是一个糟糕的假设。
因此,假设您实际上已收到带有HTML内容的邮件消息,则getContent()
不应返回null
或空字符串。 它应该按照MimeBodyPart#getContent()
上的文档返回一个InputStream
。 读取InputStream
应该可以生成带有HTML标记的字符串。
由于您似乎并不关心HTML,而只关心内容,因此只需使用Java HTML解析库(如Jsoup)即可大大简化该过程。 基本上,您可以通过将getText()
更改为以下内容将其集成到当前代码中:
private String getText(Part p) throws MessagingException, IOException {
System.out.println("getText contentType "+p.getContentType());
if (p.isMimeType("text/plain")) {
String s = (String) p.getContent();
System.out.println(s);
return s;
} else if (p.isMimeType("text/html")) {
// the last two parameters of this may need to be modified
String s = Jsoup.parse(p.getInputStream(), null, null).text();
System.out.println(s);
return s;
} else if (p.isMimeType("multipart/alternative")) {
Multipart mp = (Multipart) p.getContent();
String text = "";
for (int i = 0; i < mp.getCount(); i++) {
Part bp = mp.getBodyPart(i);
if (bp.isMimeType("text/*")) {
String s = getText(bp);
if (s != null) {
text += s;
}
}
}
return text;
}
return null;
}
请注意,这假定电子邮件足够小,可以在内存中完全读取和解析。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.