
[英]Is there a way to tell before the write how many files will be created when saving Spark Dataframe as Delta Table in Azure Data Lake Storage Gen1?
[英]Losing data formats when saving Spark dataframe to delta table in Azure Databricks
您的情况没有问题:
没有类型丢失 - Spark 需要将 map Pandas/Python 类型转换为它自己的类型。 int64
在 Spark 中是long
并且具有相同的类型。 datetime
相同 - 它是timestamp
。
关于 shuffle - 数据的顺序不是由定义定义的,类似于关系数据库。 如果您需要按特定顺序查看数据,则需要在阅读后对其进行排序。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.