簡體   English   中英

如何根據 MultiIndex 的一部分將 DataFrame 拆分為多個 DataFrame?

[英]How to split a DataFrame into multiple DataFrames based off part of a MultiIndex?

對於一個項目,我正在使用 BeautifulSoup 為我的大學抓取一些表格調度數據,然后使用 pandas.read_html() 將其讀入 DataFrame。 但是,數據位於一個大表中,該表使用兩個標題在視覺上分成多個表:一個大學標題(即“工程學院”),然后是每一列的標題(即“課程”、“開始”)。

前任:


工程學院


課程 | 開始 | 結束|...


Pandas 正確地將標題解析為 MultiIndex,其中每個索引元組的第一部分是學院,第二部分是列標題。 但是,我想要多個具有單列索引的 DataFrame,由大學分隔。 我該怎么做這樣的事情?

如果我理解正確,它是大學名稱的多級索引,后跟列,您想按大學名稱拆分。

Assuming df is your multiindex column dataframe,
di = {}
for i in df.columns.levels[0]:
    di[i] = df[i]

這將創建一個包含大學鍵值對和相應數據框的字典

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM