使用兩個 header Z3A43B4F88325D94022C0EFA9C2FA 訪問 pandas dataframe 列

Question

我使用groupby和pd.cut創建了一個 dataframe 來計算 bin 內元素的平均值、標准差和數量。 我使用了agg() ，這是我使用的命令：

df_bin=df.groupby(pd.cut(df.In_X, ranges,include_lowest=True)).agg(['mean', 'std','size'])

df_bin 看起來像這樣：

                 X                  Y
                 mean   std size   mean         std  size
In_X                    
(10.424, 10.43] 10.425  NaN  1      0.003786    NaN   1
(10.43, 10.435] 10.4    NaN  0      NaN         NaN   0

我想用第一個 header X的mean創建一個數組。 如果我沒有兩個 header 級別，我會使用類似的東西：

mean=np.array(df_bin['mean'])

但是如何用兩個標題做到這一點？

Answer 1

我們可以做的

df_bin.stack(level=0)['mean'].values

Answer 2

本文檔將為您服務： https://pandas.pydata.org/pandas-docs/stable/user_guide/advanced.html

要回答您的問題，如果您只想要一個特定的列：

mean = np.array(df_bin['X', 'mean'])

但是如果你想切片到第二層：

mean = np.array(df_bin.loc[:, (slice(None), 'mean')])

或者：

mean = np.array(df_bin.loc[:, pd.IndexSlice[:, 'mean']])

使用兩個 header Z3A43B4F88325D94022C0EFA9C2FA 訪問 pandas dataframe 列

問題描述

2 個解決方案

解決方案1
1 2020-05-22 23:58:58

解決方案2
1 已采納 2020-05-23 00:01:43

使用兩個 header Z3A43B4F88325D94022C0EFA9C2FA 訪問 pandas dataframe 列

問題描述

2 個解決方案

解決方案1 1 2020-05-22 23:58:58

解決方案2 1 已采納 2020-05-23 00:01:43

解決方案1
1 2020-05-22 23:58:58

解決方案2
1 已采納 2020-05-23 00:01:43