[英]How to generate the TPC-DS benchmarking data 1 TB in AWS S3?
我想直接在 AWS S3 中生成 TPC-DS 数据(1 TB 和 10 TB),而不是从本地机器传输到 s3。 最简单的方法是什么?
几个月前我做了类似的工作, hive-testbench可以是一个选项。 查看README.md
以了解如何实现它。
您需要将$HADOOP_HOME/etc/hadoop/core-site.xml
中的fs.defaultFS
配置到您的 AWS S3 存储桶中,数据将直接在 AWS 中生成。
将数据比例参数传递给./tpcds-setup.sh
以生成具有不同比例的日期。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.