[英]How to configure Hadoop MapReduce mapper output compression if I use org.apache.hadoop.mapreduce (new) API?
是否可以在新的mapreduce
API上啟用映射器輸出壓縮,如果可以,請指出如何? 我看到很多例子基於hadoop.mapred.JobConf
API而沒有用於mapreduce
API。
如果它不能通過new
API配置,我可以做些什么來讓它工作嗎?
您可以使用以下代碼啟用地圖輸出壓縮:
public static void enableMapOutputCompress(Job job) {
job.getConfiguration().setBoolean("mapred.compress.map.output", true);
job.getConfiguration().setClass("mapred.map.output.compression.codec",
SnappyCodec.class, CompressionCodec.class);
}
您可以將org.apache.hadoop.io.compress.SnappyCodec
更改為其他壓縮類,例如: org.apache.hadoop.io.compress.GzipCodec
, org.apache.hadoop.io.compress.LzoCodec
。
我建議使用SnappyCodec。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.