簡體   English   中英

適用於Gmail /主題的python電子郵件模塊

[英]python email module for Gmail / subject

我正在使用電子郵件模塊以mbox格式解析電子郵件。 電子郵件來自Gmail。

該代碼的重要部分是:

import email

email_content = sys.stdin.read()
email_obj = email.message_from_string(email_content)
subject = email_obj['subject']

對於這個主題,我有點奇怪的編碼。 在原始文本中,它看起來像:

Subject: =?UTF-8?B?MjAxOS4gw6FwcmlsaXMgMjUu?=

誰能告訴我它是如何編碼的,我該如何“提取”它?

非常感謝。

的Python:2.7.13

該主題已根據RFC 2047進行了編碼。這是因為電子郵件主題是標頭標簽,並且標頭標簽必須為ascii。

解碼:

>>> from email.header import decode_header
>>> decode_header("Subject: =?UTF-8?B?MjAxOS4gw6FwcmlsaXMgMjUu?=")
[('Subject:', None), ('2019. \xc3\xa1prilis 25.', 'utf-8')]

元組中的轉義字節解碼如下:

'2019. április 25.'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM