[英]How to use custom JDBC jar file from GCS in Apache Beam Java SDK
[英]How to read a file from minIO in apache beam java sdk
我刚开始使用 minio 和 apache 光束。 我在 play.min.io 上创建了一个存储桶并添加了一些文件(假设存储的文件是 one.txt 和 two.txt)。 我想使用 Apache 光束 java sdk 访问存储在该存储桶上的文件。 当我处理本地文件时,我只是传递文件的路径,如 C://new//.. 但我不知道如何从 minio 获取文件。 谁能帮我写代码。
我设法让它与标准 AWS 配置之上的一些配置一起工作:
PipelineOptions options = PipelineOptionsFactory.fromArgs(args).create();
...
options.as(AwsOptions.class).setAwsServiceEndpoint("http://localhost:9000");
这可以通过使用这种 MinioS3ClientBuilderFactory 扩展 DefaultS3ClientBuilderFactory 来完成:
public class MinioS3ClientBuilderFactory extends DefaultS3ClientBuilderFactory {
@Override
public AmazonS3ClientBuilder createBuilder(S3Options s3Options) {
AmazonS3ClientBuilder builder = super.createBuilder(s3Options);
builder.withPathStyleAccessEnabled(true);
return builder;
}
}
并将其注入如下选项中:
Class<? extends S3ClientBuilderFactory> builderFactory = MinioS3ClientBuilderFactory.class;
options.as(S3Options.class).setS3ClientFactoryClass(builderFactory);
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.