![](/img/trans.png)
[英]Creating a pandas dataframe from a file with multiple and unconventional delimiters
[英]How to read an unconventional Excel file into a Pandas DataFrame?
任何想法如何将这个复杂的 excel 文件读入 pandas DataFrame?
我试过这个:
jpm = pd.read_excel("Downloads/JPM2022_05_06.xlsx", header=10, usecols='B:P')
但我得到这个错误:
C:\Users\JWeinstein\AppData\Local\Temp\ipykernel_22400\1993557830.py:1: FutureWarning: Defining usecols with out of bounds indices is deprecated and will raise a ParserError in a future version.
我的输出是一个 DataFrame,其中包含名为Unnamed: 1
到 10 的列,并填充了NaN
值。 输出数据框应该看起来像这样,所以一旦我一步步完成阅读,就需要进行很多额外的操作。 例如,我需要填写正确的机构并将月份转换为行。
SRC agency coup vin Cbal Month CPR Pred_Month
0 JPM FHLG 1.5 2021 70.090310 December 5.418937 2022-12-01
1 JPM FHLG 1.5 2021 70.090310 January 5.549916 2023-01-01
2 JPM FHLG 1.5 2021 70.090310 February 5.238943 2023-02-01
3 JPM FHLG 1.5 2020 52.414637 December 5.514456 2022-12-01
4 JPM FHLG 1.5 2020 52.414637 January 5.550490 2023-01-01
试试这两个步骤: 1.转到您的 Excel 文件副本并在左上角单击菜单,文件>>另存为 CSV 并获取其 CSV 副本 2.如果您使用的是 Jupyter 笔记本,请在 Python 中保存您的数据文件> > Python310>> Scripts 然后尝试将其打开为 pd.read_csv("file_name")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.