如何在pd.read_excel中通过索引而不是名称指定列dtype

Question

我需要从 Excel 读取数据，但在执行此操作时，我不应按列的名称指定列。 如何使用索引设置数据类型？

例如：

df = pd.read_excel('file.xlsx', 
                 sheet_name='sheet1',
                 index_col=None, 
                 dtype={'column_x':str, 'column_y':str}, engine='openpyxl')

在这里，我可以使用以下内容而不是说明"column_x"和"column_y"来联系它们：

dtype={df.colums[0]:str, df.colums[1]:str}

谢谢

Answer 1

使用header=None然后通过它们的索引位置访问列。

df = pd.DataFrame({'A' : [0,1,2,3], 'B' : ['A','B','C','A']})

print(df.dtypes)

A     int64
B    object
dtype: object


df.to_excel('file.xlsx'index=False)
df = pd.read_excel('file.xlsx',index_col=None)
print(df.dtypes)

A     int64
B    object
dtype: object

df = pd.read_excel('file.xlsx',index_col=None,
       header=None,dtype={0 : 'str', 1 : 'str'},skiprows=1) 
       # skip the header row otherwise all cols will be read as strings.

print(df.dtypes)

0    object
1    object
dtype: object

请注意，此后您需要手动设置列。

如何在pd.read_excel中通过索引而不是名称指定列dtype

问题描述

1 个解决方案

解决方案1
0 已采纳 2020-09-24 13:35:33

如何在pd.read_excel中通过索引而不是名称指定列dtype

问题描述

1 个解决方案

解决方案1 0 已采纳 2020-09-24 13:35:33

解决方案1
0 已采纳 2020-09-24 13:35:33