在 Python (Boto3) 中打開 S3 存儲桶中的 .docx 文件

Question

在我們的一個 S3 存儲桶中，我們有一個 .docx 文件，其中包含郵件合並字段。

我要做的是直接從存儲桶中直接讀取它，而無需先在本地下載！

通常，我可以通過使用以下代碼打開一個文件並查看其中的郵件合並字段：

from mailmerge import MailMerge
document = MailMerge(r'C:\Users\User\Desktop\MailMergeFile.docx') # Trying to get a variable to pass in here
print(document.get_merge_fields())

如上所示，我想要做的是以一種可以將對象傳遞給 MailMerge 方法的方式獲取對象，就好像我在本地計算機上傳遞路徑一樣。

我所采用的方法未能奏效。

fileobj = s3.get_object(
    Bucket='bucketname',
    Key='folder/mailmergefile.docx'
    ) 

word_file = fileobj['Body'].read()
contents = word_file.decode('ISO-8859-1') # can't use utf-8 as that gives encoding error

contents

但是當我嘗試將contents變量傳遞給 Mailmerge 函數時，我收到另一個錯誤：

document = MailMerge(contents)
print(document.get_merge_fields())

我得到的錯誤是： ValueError: embedded null character

Answer 1

我猜你正在使用docx-mailmerge · PyPI 。

該文檔非常稀疏，但顯示MailMerge('input.docx') ，這表明它需要文件的名稱，而不是文件的“內容”。

在查看代碼時，它似乎正在調用一個庫來打開一個 zip 文件。

底線：正如所寫的，它需要文件的名稱，而不是文件的內容。

在 Python (Boto3) 中打開 S3 存儲桶中的 .docx 文件

問題描述

1 個解決方案

解決方案1
1 已采納 2020-04-01 06:56:32

在 Python (Boto3) 中打開 S3 存儲桶中的 .docx 文件

問題描述

1 個解決方案

解決方案1 1 已采納 2020-04-01 06:56:32

解決方案1
1 已采納 2020-04-01 06:56:32