在python中聚合多個Excel文件-pd.read_excel的列表索引錯誤

Question

我正在嘗試聚合多個文件：

import glob
import pandas as pd
import time

list_of_files = glob.glob('../data/*.xlsx')

frame = pd.DataFrame()
list_ = []

for file_ in list_of_files:
    df = pd.read_excel(file_, ignore_index=True)
    list_.append(df)

frame = pd.concat(list_)

但我給出了以下錯誤：

截圖誤差輸出

我的文件列表似乎還可以：

['../data/Chat Transcript Report 1.xlsx',
 '../data/Chat Transcript Report2.xlsx',
 '../data/Chat Transcript Report3.xlsx',
 '../data/Chat Transcript Report.xlsx']

但是錯誤似乎可以追溯到read_excel行，但是我不確定索引的問題是什么。 任何建議將不勝感激！

Answer 1

熊貓索引沒有錯。 也有一些是錯誤的，或不兼容，與您的Excel文件。 這又拿出了至少兩三次（見圖1 ， 2 ）。 該問題可能與行不整齊（請參閱xlrd issue：ragged_rows ）或Excel文件存在其他問題有關。

我建議您首先確定問題工作表：

for file_ in list_of_files:
    try:
        df = pd.read_excel(file_, ignore_index=True)
        list_.append(df)
    except IndexError:
        print(file_)

然后打開打印的file_ ，將其內容復制到另一個工作簿，然后使用新工作簿重試。 如果xlrd ，則表明第一個工作簿的某個方面與xlrd不兼容，熊貓已使用xlrd從Excel讀取數據。

在python中聚合多個Excel文件-pd.read_excel的列表索引錯誤

問題描述

1 個解決方案

解決方案1
0 已采納 2018-10-17 11:17:02

在python中聚合多個Excel文件-pd.read_excel的列表索引錯誤

問題描述

1 個解決方案

解決方案1 0 已采納 2018-10-17 11:17:02

解決方案1
0 已采納 2018-10-17 11:17:02