繁体   English   中英

适用于Gmail /主题的python电子邮件模块

[英]python email module for Gmail / subject

我正在使用电子邮件模块以mbox格式解析电子邮件。 电子邮件来自Gmail。

该代码的重要部分是:

import email

email_content = sys.stdin.read()
email_obj = email.message_from_string(email_content)
subject = email_obj['subject']

对于这个主题,我有点奇怪的编码。 在原始文本中,它看起来像:

Subject: =?UTF-8?B?MjAxOS4gw6FwcmlsaXMgMjUu?=

谁能告诉我它是如何编码的,我该如何“提取”它?

非常感谢。

的Python:2.7.13

该主题已根据RFC 2047进行了编码。这是因为电子邮件主题是标头标签,并且标头标签必须为ascii。

解码:

>>> from email.header import decode_header
>>> decode_header("Subject: =?UTF-8?B?MjAxOS4gw6FwcmlsaXMgMjUu?=")
[('Subject:', None), ('2019. \xc3\xa1prilis 25.', 'utf-8')]

元组中的转义字节解码如下:

'2019. április 25.'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM