繁体   English   中英

如何在增量表上运行 sql 查询

[英]how to run sql query on delta table

我对 delta Lake 文档有疑问。 我知道我可以使用 presto、hive、spark sql 和其他工具查询 delta 表,但在 delta 的文档中提到“您可以通过指定表名称 ae 将 Delta 表加载为 ZBA834BA059A9A379459C1121 或 Z5EB88”

从三角洲湖

但目前还不清楚。 我怎样才能像这样运行 sql 查询?

使用spark.sql() function

spark.sql("select * from delta.`hdfs://192.168.2.131:9000/Delta_Table/test001`").show()

要从 DeltaLake 中的表中读取数据,可以使用 Java API 或 Python而不使用 ZE902794AE04A06F4A 详见: https://databricks.com/blog/2020/12/22/natively-query-your-delta-lake-with-scala-java-and-python.html

了解如何与 Pandas 一起使用:

pip3 install deltalake
python3
from deltalake import DeltaTable
table_path = "/opt/data/delta/my-table" # whatever table name and object store
# now using Pandas
df = DeltaTable(table_path).to_pandas()
df

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM