繁体   English   中英

AWS Redshift Spectrum-如何在外部表中获取s3文件名

[英]AWS Redshift Spectrum - how to get the s3 filenames in the external table

我在AWS频谱中创建了外部表来查询s3数据,但是我无法识别记录所属的文件名(我在存储桶中有成千上万个文件)

在AWS Athena中,我们有一个伪列“ $ PATH”,它将显示s3文件名。在使用频谱时是否有类似的方法可用?

从最近开始,您可以使用特定的伪列来访问S3中对象的路径和大小,以获取血统信息。

http://docs.aws.amazon.com/redshift/latest/dg/c-spectrum-external-tables.html#c-spectrum-external-tables-pseudocolumns

此类查询的示例为:

>> select distinct "$path", "$size" from spectrum.sales_part;

 $path                                 | $size
---------------------------------------+-------
s3://awssampledbuswest2/tickit/spectrum/sales_partition/saledate=2008-01/ |  1616
s3://awssampledbuswest2/tickit/spectrum/sales_partition/saledate=2008-02/ |  1444
s3://awssampledbuswest2/tickit/spectrum/sales_partition/saledate=2008-02/ |  1444

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM