如何從pandas中的groupby對象中選擇列？

Question

我按下面的兩列對我的數據框進行了分組

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': [7L, 8L, 9L],
                   'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median()

結果是：

            b    c
a name            
1 hello  4.75  7.5
3 foo    6.00  9.0

如何訪問結果中位數的name字段（在本例中為hello, foo ）？ 這失敗了：

df.groupby(['a', 'name']).median().name

Answer 1

在 groupby 期間設置as_index = False

df = pandas.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df.groupby(["a", "name"] , as_index = False).median()

Answer 2

您需要獲取索引值，它們不是列。 在這種情況下，級別 1

df.groupby(["a", "name"]).median().index.get_level_values(1)

Out[2]:

Index([u'hello', u'foo'], dtype=object)

您還可以傳遞索引名稱

df.groupby(["a", "name"]).median().index.get_level_values('name')

因為這比傳遞整數值更直觀。

您可以通過調用tolist()將索引值轉換為列表

df.groupby(["a", "name"]).median().index.get_level_values(1).tolist()

Out[5]:

['hello', 'foo']

Answer 3

您還可以在 groupby 結果上reset_index()以獲取現在可以訪問名稱列的數據reset_index() 。

import pandas as pd
df = pd.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df_grouped = df.groupby(["a", "name"]).median().reset_index()
df_grouped.name
 0    hello
 1      foo
 Name: name, dtype: object

如果您對單個列執行操作，則返回將是一個具有多pd.DataFrame的系列，您可以簡單地將pd.DataFrame應用到它然后 reset_index。

Answer 4

在 group by 之后使用 reset_index() 可以解決問題：

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': ['7L', '8L', '9L'],
                   'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median().reset_index().name

結果如下：

 0    hello
 1      foo
 Name: name, dtype: object

如果你想要值的列表，你可以簡單地：

df = pd.DataFrame({'a': [1, 1, 3],
                   'b': [4.0, 5.5, 6.0],
                   'c': ['7L', '8L', '9L'],
                   'name': ['hello', 'hello', 'foo']})

df.groupby(['a', 'name']).median().reset_index().name.values

使用值的結果將是一個包含名稱列值的列表。 上面的代碼返回以下列表作為結果：

array(['hello', 'foo'], dtype=object)

如何從pandas中的groupby對象中選擇列？

問題描述

4 個解決方案

解決方案1
28 2014-10-31 05:39:52

解決方案2
24 已采納 2013-10-05 20:03:57

解決方案3
5 2013-10-06 00:05:15

解決方案4
2 2020-03-05 19:02:37

如何從pandas中的groupby對象中選擇列？

問題描述

4 個解決方案

解決方案1 28 2014-10-31 05:39:52

解決方案2 24 已采納 2013-10-05 20:03:57

解決方案3 5 2013-10-06 00:05:15

解決方案4 2 2020-03-05 19:02:37

解決方案1
28 2014-10-31 05:39:52

解決方案2
24 已采納 2013-10-05 20:03:57

解決方案3
5 2013-10-06 00:05:15

解決方案4
2 2020-03-05 19:02:37