简体繁体 English

压缩Hadoop存档工具的输出

[英]Compress output of Hadoop Archive tool

原文 2016-07-04 09:55:40 6 1 hadoop/ yarn/ hadoop-archive/ bigdata

I'm using Hadoop Archive for reduce number of files in my Hadoop cluster, but for data retention, I want to keep my data as long as possible. 我正在使用Hadoop Archive来减少Hadoop集群中的文件数量，但是为了保留数据，我希望尽可能长时间地保留数据。 Then the problem is Hadoop Archive not reduce folder size (my folder have multi-type of file, both small and large file, then not suitable for use Sequence File). 然后问题是Hadoop Archive没有减小文件夹大小（我的文件夹有多种类型的文件，无论是小文件还是大文件，那么不适合使用Sequence File）。

I used some option like -D mapreduce.compress.map.output=true -D mapred.map.ouput.compress.codec=org.apache.hadoop.io.compress.GzipCodec but it's not work. 我使用了一些选项，如-D mapreduce.compress.map.output=true -D mapred.map.ouput.compress.codec=org.apache.hadoop.io.compress.GzipCodec但它不起作用。

Does anyone know a way for compress output of Hadoop Archive, or suggest me someway to get both goal (compress size and reduce number of file). 有没有人知道压缩Hadoop Archive输出的方法，或者建议我得到两个目标（压缩大小和减少文件数）。

Any infomation is appreciate. 任何信息都很感激。 Thanks so much. 非常感谢。

1 个解决方案

您可以使用mapred compress并在压缩目录上运行har

无法使用hadoop存档工具进行存档 - unable to archive using hadoop archive tool

Hadoop，如何压缩映射器输出但不压缩reducer输出 - Hadoop, how to compress mapper output but not the reducer output

hadoop程序中压缩地图输出结果异常 - Compress map output result exception in hadoop program

Hadoop映射器压缩输出不起作用？ - Hadoop mapper compress output doesn't work?

哪种压缩格式适合hadoop中的大型地图输出？ - Which format of compress is suitable for large map output in hadoop?

Hadoop：在HDFS中压缩文件？ - Hadoop: compress file in HDFS?

Hadoop HDFS压缩到位 - Hadoop HDFS compress in place

Hadoop作为数据存档系统 - Hadoop as Data Archive System

Hadoop 存档命令 - Hadoop Archive Command

使用gzip编解码器压缩Hadoop Mapreduce中reducer的输出时出错 - Error while using gzip codec to compress output from reducer in Hadoop Mapreduce

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 无法使用hadoop存档工具进行存档 - unable to archive using hadoop archive tool Hadoop，如何压缩映射器输出但不压缩reducer输出 - Hadoop, how to compress mapper output but not the reducer output hadoop程序中压缩地图输出结果异常 - Compress map output result exception in hadoop program Hadoop映射器压缩输出不起作用？ - Hadoop mapper compress output doesn't work? 哪种压缩格式适合hadoop中的大型地图输出？ - Which format of compress is suitable for large map output in hadoop? Hadoop：在HDFS中压缩文件？ - Hadoop: compress file in HDFS? Hadoop HDFS压缩到位 - Hadoop HDFS compress in place Hadoop作为数据存档系统 - Hadoop as Data Archive System Hadoop 存档命令 - Hadoop Archive Command 使用gzip编解码器压缩Hadoop Mapreduce中reducer的输出时出错 - Error while using gzip codec to compress output from reducer in Hadoop Mapreduce

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM