繁体   English   中英

如何在 AWS S3 中生成 1 TB 的 TPC-DS 基准测试数据?

[英]How to generate the TPC-DS benchmarking data 1 TB in AWS S3?

我想直接在 AWS S3 中生成 TPC-DS 数据(1 TB 和 10 TB),而不是从本地机器传输到 s3。 最简单的方法是什么?

几个月前我做了类似的工作, hive-testbench可以是一个选项。 查看README.md以了解如何实现它。

您需要将$HADOOP_HOME/etc/hadoop/core-site.xml中的fs.defaultFS配置到您的 AWS S3 存储桶中,数据将直接在 AWS 中生成。
将数据比例参数传递给./tpcds-setup.sh以生成具有不同比例的日期。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM