![](/img/trans.png)
[英]Segmentation Fault while reading parquet file from AWS S3 using read_parquet in Python Pandas
[英]modin pandas read_parquet() failed on ETag KeyError trying to read a partitioned parquet from s3
我從熊貓創建了一個數據框,並使用 to_parquet(...) 直接寫入 s3。
論據是:
df.to_parquet('s3://bucket/fn.parquet', compression='gzip', engine='fastparquet', partition_cols=['col1'])
當我使用熊貓的pandas.read_parquet(url)
,數據pandas.read_parquet(url)
加載良好。
但是當我使用modin.pandas.read_parquet(url)
,出現以下錯誤:
File "/home/mguo/anaconda3/envs/testenv/lib/python3.7/site-packages/s3fs/core.py", line 1779, in __init__
self.req_kw["IfMatch"] = self.details["ETag"]
KeyError: 'ETag'
以下是我的版本:
python==3.7.3
pandas==1.2.4
modin==0.10.0
s3fs==2021.6.0
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.