繁体   English   中英

如何读取 python 中的 data.parquet.gz 文件?

[英]How to read data.parquet.gz file in python?

如何读取文件data.parquet.gz并将其转换为 pandas dataframe?

下面的代码给出错误:

无法打开 Parquet 输入源“”:在页脚中找不到 Parquet 魔术字节。 文件已损坏,或者这不是镶木地板文件。

df = pd.read_parquet('data.parquet.gz')

您的文件是一个 gzip 存档,您可以阅读如下:

import gzip

with gzip.open('data.parquet.gz', 'rb') as f:
  df = pd.read_parquet(f)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM