簡體   English   中英

Python IMAP 下載所有附件

[英]Python IMAP download all attachments

我需要將所有郵件迭代到 GMAIL 收件箱中。 另外我需要下載每封郵件的所有附件(有些郵件有 4-5 個附件)。 我在這里找到了一些幫助: https : //stackoverflow.com/a/27556667/8996442

def save_attachments(self, msg, download_folder="/tmp"):
    for part in msg.walk():
        if part.get_content_maintype() == 'multipart':
            continue
        if part.get('Content-Disposition') is None:
            continue

        filename = part.get_filename()
        print(filename)
        att_path = os.path.join(download_folder, filename)
        if not os.path.isfile(att_path):
            fp = open(att_path, 'wb')
            fp.write(part.get_payload(decode=True))
            fp.close()
        return att_path

但是,它每封電子郵件只下載一個附件(但帖子的作者提到它通常會下載所有附件,不是嗎?)。 print(filename)只顯示一個附件知道為什么嗎?

從 imap_tools 導入郵箱

# get all attachments from INBOX and save them to files
with MailBox('imap.my.ru').login('acc', 'pwd', 'INBOX') as mailbox:
    for msg in mailbox.fetch():
        for att in msg.attachments:
            print(att.filename, att.content_type)
            with open('C:/1/{}'.format(att.filename), 'wb') as f:
                f.write(att.payload)

https://pypi.org/project/imap-tools/

正如評論中已經指出的那樣,當前的問題是return退出for循環並離開函數,並且在保存第一個附件后立即執行此操作。

根據您究竟想要完成什么,更改您的代碼,以便您僅在完成msg.walk()所有迭代后才return 這是返回附件文件名列表的一種嘗試:

def save_attachments(self, msg, download_folder="/tmp"):
    att_paths = []

    for part in msg.walk():
        if part.get_content_maintype() == 'multipart':
            continue
        if part.get('Content-Disposition') is None:
            continue

        filename = part.get_filename()
        # Don't print
        # print(filename)
        att_path = os.path.join(download_folder, filename)
        if not os.path.isfile(att_path):
            # Use a context manager for robustness
            with open(att_path, 'wb') as fp:
                fp.write(part.get_payload(decode=True))
            # Then you don't need to explicitly close
            # fp.close()
        # Append this one to the list we are collecting
        att_paths.append(att_path)

    # We are done looping and have processed all attachments now
    # Return the list of file names
    return att_paths

請參閱內嵌注釋以了解我更改的內容和原因。

一般來說,避免在工作函數內部使用print()東西; 要么使用logging以調用者可以控制的方式打印診斷信息,要么只返回信息並讓調用者決定是否將其呈現給用戶。

並非所有 MIME 部分都有Content-Disposition: ; 事實上,我希望這會錯過大多數附件,並可能提取一些內聯部分。 更好的方法可能是查看該部分是否有Content-Disposition: attachment ,如果沒有Content-Disposition:Content-Type:不是text/plaintext/html ,則繼續提取。 也許另請參閱多部分電子郵件中的“部分”是什么?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM