如何将非常规的 Excel 文件读入 Pandas DataFrame？

Question

任何想法如何将这个复杂的 excel 文件读入 pandas DataFrame？

我试过这个：

jpm = pd.read_excel("Downloads/JPM2022_05_06.xlsx",  header=10, usecols='B:P')

但我得到这个错误：

C:\Users\JWeinstein\AppData\Local\Temp\ipykernel_22400\1993557830.py:1: FutureWarning: Defining usecols with out of bounds indices is deprecated and will raise a ParserError in a future version.

我的输出是一个 DataFrame，其中包含名为Unnamed: 1到 10 的列，并填充了NaN值。 输出数据框应该看起来像这样，所以一旦我一步步完成阅读，就需要进行很多额外的操作。 例如，我需要填写正确的机构并将月份转换为行。

    SRC agency coup vin     Cbal       Month    CPR         Pred_Month
0   JPM FHLG    1.5 2021    70.090310   December 5.418937   2022-12-01
1   JPM FHLG    1.5 2021    70.090310   January  5.549916   2023-01-01
2   JPM FHLG    1.5 2021    70.090310   February 5.238943   2023-02-01
3   JPM FHLG    1.5 2020    52.414637   December 5.514456   2022-12-01
4   JPM FHLG    1.5 2020    52.414637   January  5.550490   2023-01-01

Answer 1

试试这两个步骤： 1.转到您的 Excel 文件副本并在左上角单击菜单，文件>>另存为 CSV 并获取其 CSV 副本 2.如果您使用的是 Jupyter 笔记本，请在 Python 中保存您的数据文件> > Python310>> Scripts 然后尝试将其打开为 pd.read_csv("file_name")

如何将非常规的 Excel 文件读入 Pandas DataFrame？

问题描述

1 个解决方案

解决方案1
1 2022-06-09 18:39:58

如何将非常规的 Excel 文件读入 Pandas DataFrame？

问题描述

1 个解决方案

解决方案1 1 2022-06-09 18:39:58

解决方案1
1 2022-06-09 18:39:58