繁体   English   中英

如何将非常规的 Excel 文件读入 Pandas DataFrame?

[英]How to read an unconventional Excel file into a Pandas DataFrame?

任何想法如何将这个复杂的 excel 文件读入 pandas DataFrame?

桌子

我试过这个:

jpm = pd.read_excel("Downloads/JPM2022_05_06.xlsx",  header=10, usecols='B:P')

但我得到这个错误:

C:\Users\JWeinstein\AppData\Local\Temp\ipykernel_22400\1993557830.py:1: FutureWarning: Defining usecols with out of bounds indices is deprecated and will raise a ParserError in a future version.

我的输出是一个 DataFrame,其中包含名为Unnamed: 1到 10 的列,并填充了NaN值。 输出数据框应该看起来像这样,所以一旦我一步步完成阅读,就需要进行很多额外的操作。 例如,我需要填写正确的机构并将月份转换为行。

    SRC agency coup vin     Cbal       Month    CPR         Pred_Month
0   JPM FHLG    1.5 2021    70.090310   December 5.418937   2022-12-01
1   JPM FHLG    1.5 2021    70.090310   January  5.549916   2023-01-01
2   JPM FHLG    1.5 2021    70.090310   February 5.238943   2023-02-01
3   JPM FHLG    1.5 2020    52.414637   December 5.514456   2022-12-01
4   JPM FHLG    1.5 2020    52.414637   January  5.550490   2023-01-01

试试这两个步骤: 1.转到您的 Excel 文件副本并在左上角单击菜单,文件>>另存为 CSV 并获取其 CSV 副本 2.如果您使用的是 Jupyter 笔记本,请在 Python 中保存您的数据文件> > Python310>> Scripts 然后尝试将其打开为 pd.read_csv("file_name")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM