簡體 English 中英

復制並從S3解壓縮到HDFS

[英]Copy and unzip from S3 to HDFS

原文 2016-07-20 06:13:46 1 1 json/ apache-spark/ amazon-s3/ zip/ gzip

我在S3上有一些大的zip文件。 這些zip文件中的每一個都包含幾個gz文件，其中包含JSON格式的數據。 我需要（i）將gz文件復制到HDFS和（ii）優選地通過Apache Spark / Impala / Hive處理文件。 最簡單/最好的方法是什么？

1 個解決方案

1）嘗試使用distcp將文件從s3復制到HDFS

2）對於處理，使用“ org.apache.spark.sql.hive.HiveContext ”的read.json從HDFS讀取JSON數據並創建數據幀。 然后對它進行任何操作。

請點擊此鏈接， http：//spark.apache.org/docs/latest/sql-programming-guide.html#creating-dataframes

使用復制命令將數據從s3加載到redshift

[英]Loading data from s3 to redshift using copy command

將 json.gz 的命令從 s3 復制到 redshift

[英]copy command for json.gz from s3 to redshift

將具有多個值的JSON從S3復制到Redshift

[英]Copy JSON with multiple values from S3 to Redshift

Redshift / S3-將Redshift表的內容作為JSON復制到S3嗎？

[英]Redshift/S3 - Copy the contents of a Redshift table to S3 as JSON?

使用python boto將json文件從我的本地計算機復制到Amazon S3

[英]using python boto to copy json file from my local machine to amazon S3

使用 CLI 將 JSON 文件從 windows 系統中的 AWS S3 存儲桶復制到本地

[英]Copy JSON files to local from AWS S3 bucket in windows system using CLI

從S3返回JSON

[英]Return JSON from S3

如何從S3存儲/重新作為JSON

[英]How To Store/Retrive from S3 As JSON

從 S3 存儲桶解析 JSON 文件

[英]Parsing a JSON file from a S3 Bucket

雪花從 s3 json 讀取 null

[英]snowflake read null from s3 json

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用復制命令將數據從s3加載到redshift 將 json.gz 的命令從 s3 復制到 redshift 將具有多個值的JSON從S3復制到Redshift Redshift / S3-將Redshift表的內容作為JSON復制到S3嗎？使用python boto將json文件從我的本地計算機復制到Amazon S3 使用 CLI 將 JSON 文件從 windows 系統中的 AWS S3 存儲桶復制到本地從S3返回JSON 如何從S3存儲/重新作為JSON 從 S3 存儲桶解析 JSON 文件雪花從 s3 json 讀取 null

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM