如何遍历 Excel 工作表和逆透视数据框。然后将它们附加到一个 daraframe 中

Question

I have Excel with 3 sheets: Gross, Margin, Revenue.我有 3 张 Excel 表格：毛额、利润率、收入。 Each of them has a table with same columns and row headers.他们每个人都有一个具有相同列和行标题的表格。

I need to :我需要：

1) iterate through each sheet and save into a dataframe 1）遍历每个工作表并保存到数据框中

2) unpivot each dataframe 2) 取消每个数据框的旋转

3) append value columns from each daraframe into one. 3) 将每个 daraframe 中的值列附加为一个。

Gross:总的：

Margin:利润：

Revenue:收入：

Outcome should be like this:结果应该是这样的：

If I use sheet_name=None then I get an error:如果我使用sheet_name=None那么我会收到一个错误：

import pandas as pd
df = pd.read_excel('BudgetData.xlsx', sheet_name=None,index=False)
df_unpv = df.melt(id_vars=['Company'], var_name ='Month', value_name = 'Gross Revenue')
print(df_unpv)

Error I get:我得到的错误：

AttributeError                            Traceback (most recent call last)
<ipython-input-60-ee1791c449b1> in <module>
      1 import pandas as pd
      2 df = pd.read_excel('BudgetData.xlsx', sheet_name=None,index=False)
----> 3 df_unpv = df.melt(id_vars=['Company'], var_name ='Month', value_name = 'Gross Revenue')
      4 df_unpv
      5 

AttributeError: 'collections.OrderedDict' object has no attribute 'melt'

Excel file with sample data can be found here: https://www.dropbox.com/s/9dsnylng70t5a8i/Count%20Open%20and%20Closed%20at%20Point%20of%20time.pbix?dl=0可以在此处找到包含示例数据的 Excel 文件： https : //www.dropbox.com/s/9dsnylng70t5a8i/Count%20Open%20and%20Closed%20at%20Point%20of%20time.pbix?dl=0

Answer 1

You are trying to call the .melt() method from your df object, instead of calling it from pd as the docs say:您正在尝试从df对象调用.melt()方法，而不是像文档所说的那样从pd调用它：

pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None)

Parameters:参数：
frame : DataFrame id_vars : tuple, list, or ndarray, optional Column(s) to use as identifier variables. frame : DataFrame id_vars : 元组、列表或 ndarray，可选 Column(s) 用作标识符变量。

value_vars : tuple, list, or ndarray, optional Column(s) to unpivot. value_vars : 元组、列表或 ndarray，可选的 Column(s) to unpivot。 If not specified, uses all columns that are not set as id_vars.如果未指定，则使用所有未设置为 id_vars 的列。

var_name : scalar Name to use for the 'variable' column. var_name ：用于“变量”列的标量名称。 If None it uses frame.columns.name or 'variable'.如果 None 它使用 frame.columns.name 或“变量”。

value_name : scalar, default 'value' Name to use for the 'value' column. value_name ：标量，默认 'value' 用于 'value' 列的名称。

col_level : int or string, optional If columns are a MultiIndex then use this level to melt. col_level : int 或 string，可选如果列是 MultiIndex 则使用此级别来融化。

如何遍历 Excel 工作表和逆透视数据框。然后将它们附加到一个 daraframe 中

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-01-28 16:50:09

如何遍历 Excel 工作表和逆透视数据框。 然后将它们附加到一个 daraframe 中

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-01-28 16:50:09

如何遍历 Excel 工作表和逆透视数据框。然后将它们附加到一个 daraframe 中

解决方案1
1 已采纳 2020-01-28 16:50:09