在 pandas 中读取镶木地板文件（read_parquet()）时如何保留 dtypes？

Question

Code:代码：

In [31]: df = pd.DataFrame({"a": [[{"b": 1}], [{"b": np.nan}]]})

In [32]: df
Out[32]:
              a
0    [{'b': 1}]
1  [{'b': nan}]

In [33]: df.dtypes
Out[33]:
a    object
dtype: object

In [34]: df.to_parquet("a.parquet")

In [35]: pd.read_parquet("a.parquet")
Out[35]:
               a
0   [{'b': 1.0}]
1  [{'b': None}]

As you can see here, [{'b': 1}] becomes [{'b': 1.0}] .正如您在此处看到的， [{'b': 1}]变为[{'b': 1.0}] 。

How can I keep dtypes even in reading the parquet file?即使在阅读镶木地板文件时，我如何保持 dtypes？

Answer 1

Try to turn on use_nullable_dtypes尝试开启use_nullable_dtypes

df = pd.DataFrame({"a": [[{"b": 1}], [{"b": None}]]})
df.dtypes

df.to_parquet("a.parquet")
pd.read_parquet("a.parquet", use_nullable_dtypes=True)

	a一个
0 0	[{'b': 1.0}] [{'b': 1.0}]
1 1	[{'b': None}] [{'b'：无}]

See the pandas doc for more explaination有关更多说明，请参阅pandas 文档

在 pandas 中读取镶木地板文件（read_parquet()）时如何保留 dtypes？

问题描述

1 个解决方案

解决方案1
0 2022-08-16 13:44:33

在 pandas 中读取镶木地板文件（read_parquet()）时如何保留 dtypes？

问题描述

1 个解决方案

解决方案1 0 2022-08-16 13:44:33

解决方案1
0 2022-08-16 13:44:33