[英]python email module for Gmail / subject
我正在使用電子郵件模塊以mbox格式解析電子郵件。 電子郵件來自Gmail。
該代碼的重要部分是:
import email
email_content = sys.stdin.read()
email_obj = email.message_from_string(email_content)
subject = email_obj['subject']
。
對於這個主題,我有點奇怪的編碼。 在原始文本中,它看起來像:
Subject: =?UTF-8?B?MjAxOS4gw6FwcmlsaXMgMjUu?=
。 誰能告訴我它是如何編碼的,我該如何“提取”它?
非常感謝。
的Python:2.7.13
。
該主題已根據RFC 2047進行了編碼。這是因為電子郵件主題是標頭標簽,並且標頭標簽必須為ascii。
解碼:
>>> from email.header import decode_header
>>> decode_header("Subject: =?UTF-8?B?MjAxOS4gw6FwcmlsaXMgMjUu?=")
[('Subject:', None), ('2019. \xc3\xa1prilis 25.', 'utf-8')]
元組中的轉義字節解碼如下:
'2019. április 25.'
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.