[英]Read file data from aws s3 pyspark
我在s3中放置了一個json文件。 s3網址類似於以下網址:
https://s3-eu-region-1.amazonaws.com/dir-resources/sample.json
但是在pyspark中傳遞相同的內容時,它沒有讀取文件。
path = "https://s3-eu-region-1.amazonaws.com/dir-resources/sample.json"
df=spark.read.json(path)
但是我可以通過瀏覽器下載它。
假設dir-resources
是存儲桶的名稱,則您應該能夠使用以下URI訪問文件:
path = "s3://dir-resources/sample.json"
在某些情況下,您可能不得不使用s3n協議:
path = "s3n://dir-resources/sample.json"
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.