[英]How to read data.parquet.gz file in python?
如何读取文件data.parquet.gz并将其转换为 pandas dataframe?
下面的代码给出错误:
无法打开 Parquet 输入源“”:在页脚中找不到 Parquet 魔术字节。 文件已损坏,或者这不是镶木地板文件。
df = pd.read_parquet('data.parquet.gz')
您的文件是一个 gzip 存档,您可以阅读如下:
import gzip
with gzip.open('data.parquet.gz', 'rb') as f:
df = pd.read_parquet(f)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.