[英]How to select columns from groupby object in pandas?
我按下面的兩列對我的數據框進行了分組
df = pd.DataFrame({'a': [1, 1, 3],
'b': [4.0, 5.5, 6.0],
'c': [7L, 8L, 9L],
'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median()
結果是:
b c
a name
1 hello 4.75 7.5
3 foo 6.00 9.0
如何訪問結果中位數的name
字段(在本例中為hello, foo
)? 這失敗了:
df.groupby(['a', 'name']).median().name
在 groupby 期間設置as_index = False
df = pandas.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df.groupby(["a", "name"] , as_index = False).median()
您需要獲取索引值,它們不是列。 在這種情況下,級別 1
df.groupby(["a", "name"]).median().index.get_level_values(1)
Out[2]:
Index([u'hello', u'foo'], dtype=object)
您還可以傳遞索引名稱
df.groupby(["a", "name"]).median().index.get_level_values('name')
因為這比傳遞整數值更直觀。
您可以通過調用tolist()
將索引值轉換為列表
df.groupby(["a", "name"]).median().index.get_level_values(1).tolist()
Out[5]:
['hello', 'foo']
您還可以在 groupby 結果上reset_index()
以獲取現在可以訪問名稱列的數據reset_index()
。
import pandas as pd
df = pd.DataFrame({"a":[1,1,3], "b":[4,5.5,6], "c":[7,8,9], "name":["hello","hello","foo"]})
df_grouped = df.groupby(["a", "name"]).median().reset_index()
df_grouped.name
0 hello
1 foo
Name: name, dtype: object
如果您對單個列執行操作,則返回將是一個具有多pd.DataFrame
的系列,您可以簡單地將pd.DataFrame
應用到它然后 reset_index。
在 group by 之后使用 reset_index() 可以解決問題:
df = pd.DataFrame({'a': [1, 1, 3],
'b': [4.0, 5.5, 6.0],
'c': ['7L', '8L', '9L'],
'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median().reset_index().name
結果如下:
0 hello
1 foo
Name: name, dtype: object
如果你想要值的列表,你可以簡單地:
df = pd.DataFrame({'a': [1, 1, 3],
'b': [4.0, 5.5, 6.0],
'c': ['7L', '8L', '9L'],
'name': ['hello', 'hello', 'foo']})
df.groupby(['a', 'name']).median().reset_index().name.values
使用值的結果將是一個包含名稱列值的列表。 上面的代碼返回以下列表作為結果:
array(['hello', 'foo'], dtype=object)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.