簡體   English   中英

Python3與Python2解析電子郵件正文不同

[英]Python3 Parsing Email Body Differently than Python2

目前,我正在使用僅使用imaplib建立與我的gmail帳戶的連接並閱讀新電子郵件的電子郵件解析器。

這一切都很好,並且使用python2(即“ python myScript.py”)運行腳本時,結果與預期的一樣

例如,如果我有一封看起來像這樣的電子郵件:

To: receiver@qwerty.com
From: sender@asdf.com
Subject: Test Subject

Test1
Test2

我的腳本將按預期輸出:

To: receiver@qwerty.com
From: sender@asdf.com
Subject: Test Subject
Body: Test1
Test2

但是,使用python3(即“ python3 myScript.py”)運行此命令時,結果不相同,轉義字符顯示在消息正文中,請參見下文:

To: receiver@qwerty.com
From: sender@asdf.com
Subject: Test Subject
Body: b'Test1\r\nTest2\r\n'

以下是用於此過程的代碼:

def readMailbox(mail):
    res, data = mail.uid('search', None, 'UNSEEN')
    i = len(data[0].split())

    for x in range(i):
        latestEmailUID = data[0].split()[x]
        result, emailData = mail.uid('fetch', latestEmailUID, '(RFC822)')
        emailMessage = email.message_from_string(emailData[0][1].decode('utf-8'))

        emailFrom = str(email.header.make_header(email.header.decode_header(emailMessage['From'])))
        emailTo = str(email.header.make_header(email.header.decode_header(emailMessage['To'])))
        subject = str(email.header.make_header(email.header.decode_header(emailMessage['Subject'])))

        # Body details
        for part in emailMessage.walk():
            if part.get_content_type() == 'text/plain':
                body = part.get_payload(decode=True)
                print('To: %s' % emailTo)
                print('From: %s' % emailFrom)
                print('Subject: %s' % subject)
                print('Body: %s' % body)

我將需要能夠在不顯示轉義字符的情況下捕獲字符串主體,以供以后使用。 誰能向我解釋為什么會這樣,或者我需要在python3中做不同的事情以便我可以正常解析電子郵件的正文嗎?

感謝您的寶貴時間,我們將非常感謝您提供正確指導的指導!

字符串前面的“ b”表示它仍是一個字節數組,尚未被解碼。

像其他字符串一樣用'utf-8'進行解碼,它應該像預期的那樣打印特殊字符

...
body = part.get_payload(decode=True)
body = body.decode('utf-8')
print('Body: %s' % body)
...

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM