遍歷excel的不同標簽，提取數據並放入dataframe

Question

我有一個 excel 工作簿 df，其中包含兩個選項卡Sheet1和Sheet2 。 我想從兩個選項卡中提取值並使用 openpyxl/Pandas 創建一個新的 dataframe。

表 1

      2021    2021
      q1      q2
ID    1       1
ID2   3       3
name  A       A

表 2

  2021    2021
      q1      q2
ID    2       2
ID2   2       2
name  B       B

期望的

quarter year ID   ID2   name

q1     2021  1    3     A
q1     2021  2    2     B

正在做

#Load openpyxl

import openpyxl

wb = openpyxl.load_workbook("df.xlsx")
ws1 = wb.worksheets[0]
ws2 = wb.worksheets[1]


#create loop that will iterate over the first row and end at 2nd column for each sheet

for row in ws1.iter_rows(min_row = 0, max_col = 1, max_row = 3, min_col = 0 
                            for cell in row:
                                 print(cell.value, end="")
                            print()


for row in ws2.iter_rows(min_row = 0, max_col = 1,  max_row = 3, min_col = 0 
                            for cell in row:
                                 print(cell.value, end="")
                            print()

我無法從收集的值中創建新的 dataframe。 任何建議或意見表示贊賞。 我仍在對此進行故障排除。

Answer 1

pd.read_excel 可以讀取一個或多個特定的工作表，如下所示：

import pandas as pd
dict_dfs = pd.read_excel("df.xlsx", sheet_name=[0,1])

df = pd.concat(dict_dfs)

之后，如果 excel 文件的格式已經允許，您可以遍歷數據幀字典或直接組合它們。

示例，加載樣本數據后：

import pandas as pd
df1 = pd.DataFrame({'2021': {'_': 'q1', 'ID': '2', 'ID2': '2', 'name': 'B'},
 '2021.1': {'_': 'q2', 'ID': '2', 'ID2': '2', 'name': 'B'}})
df2 = pd.DataFrame({'2021': {'_': 'q1', 'ID': '1', 'ID2': '3', 'name': 'A'},
 '2021.1': {'_': 'q2', 'ID': '1', 'ID2': '3', 'name': 'A'}})


df = pd.concat([df1.T,df2.T])
df.index = df.index.str.split(".").str[0]
print(df)
#        _ ID ID2 name
# 2021  q1  2   2    B
# 2021  q2  2   2    B
# 2021  q1  1   3    A
# 2021  q2  1   3    A

.T為您提供轉置的 dataframe。

遍歷excel的不同標簽，提取數據並放入dataframe

問題描述

1 個解決方案

解決方案1
1 2021-05-11 21:58:34

遍歷excel的不同標簽，提取數據並放入dataframe

問題描述

1 個解決方案

解決方案1 1 2021-05-11 21:58:34

解決方案1
1 2021-05-11 21:58:34