如何使用 boto3 訪問 AWS S3 數據

Question

我對 S3 和 boto3 都很陌生。 我正在嘗試以下列格式讀取一些數據：

https://blahblah.s3.amazonaws.com/data1.csv
https://blahblah.s3.amazonaws.com/data2.csv
https://blahblah.s3.amazonaws.com/data3.csv

我正在導入boto3 ，看來我需要做類似的事情：

import boto3
s3 = boto3.client('s3')

但是，如果我想在內存中單獨讀取所有文件（我不應該在本地下載這些數據），那么在創建這個客戶端之后我應該怎么做？ 理想情況下，我想將每個 CSV 數據文件讀入單獨的 Pandas 數據幀（一旦我知道如何訪問 S3 數據，我就知道該怎么做）。

請理解我對boto3和S3都很陌生，所以我什至不知道從哪里開始。

Answer 1

試試這個：

import boto3
s3 = boto3.resource('s3')
obj = s3.Object(<<bucketname>>, <<itemname>>)
body = obj.get()['Body'].read()

Answer 2

您將有 2 個選項，您已經提到的兩個選項：

使用download_file在本地下載文件

s3.download_file(
    "<bucket-name>", 
    "<key-of-file>", 
    "<local-path-where-file-will-be-downloaded>"
)

見下載文件

使用 get_object 將文件內容加載到get_object

response = s3.get_object(Bucket="<bucket-name>", Key="<key-of-file>")
contentBody = response.get("Body")
# You need to read the content as it is a Stream
content = contentBody.read()

見get_object

兩種方法都可以，您可以選擇更適合您的場景的方法。

如何使用 boto3 訪問 AWS S3 數據

問題描述

2 個解決方案

解決方案1
3 2020-02-22 19:05:21

解決方案2
3 已采納 2020-02-22 19:09:31

如何使用 boto3 訪問 AWS S3 數據

問題描述

2 個解決方案

解決方案1 3 2020-02-22 19:05:21

解決方案2 3 已采納 2020-02-22 19:09:31

解決方案1
3 2020-02-22 19:05:21

解決方案2
3 已采納 2020-02-22 19:09:31