簡體   English   中英

從AWS S3 pyspark讀取文件數據

[英]Read file data from aws s3 pyspark

我在s3中放置了一個json文件。 s3網址類似於以下網址:

https://s3-eu-region-1.amazonaws.com/dir-resources/sample.json

但是在pyspark中傳遞相同的內容時,它沒有讀取文件。

path = "https://s3-eu-region-1.amazonaws.com/dir-resources/sample.json"
df=spark.read.json(path)

但是我可以通過瀏覽器下載它。

假設dir-resources是存儲桶的名稱,則您應該能夠使用以下URI訪問文件:

path = "s3://dir-resources/sample.json"

在某些情況下,您可能不得不使用s3n協議:

path = "s3n://dir-resources/sample.json"

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM