熊貓groupby對多索引排序

Question

import pandas as pd

values = {'C1': ['B', 'A'],
          'C2': ['B', 'A'],
          'C3': ['B', 'A'],   
          }          

df = pd.DataFrame(values)
df.set_index(keys=['C1', 'C2'], inplace=True)

grouped = df.groupby(level='C1', sort=False)

for name, group in grouped:
    print(name)

產量

一種
乙

但是，我希望

乙
一種

如何獲得第二個結果？

Answer 1

如我的評論中所述，這可能是一個已知問題。

也許這是一個有效的解決方法：

import pandas as pd

values = {'C1': ['B', 'A'],
          'C2': ['B', 'A'],
          'C3': ['B', 'A'],   
          }          

df = pd.DataFrame(values)

grouped = df.groupby(['C1', 'C2'], sort=False)['C3']

for name, group in grouped:
    print group.iloc[0]

結果

乙

一種

Answer 2

考慮重組數據

除非您的實際數據要求您重置為MultiIndex ，否則在進行groupby()之前似乎無需重新索引。

如果僅按C1 groupby則會得到所需的示例輸出：

import pandas as pd

values = {'C1': ['B', 'A'],
          'C2': ['B', 'A'],
          'C3': ['B', 'A'],   
          }          

df = pd.DataFrame(values)

print 'Original DataFrame'
print df
print

df2 = df.set_index(keys=['C1', 'C2'], inplace=False)

print 'Reindexed DataFrame'
print df2
print

grouped = df.groupby(['C1'], sort=False)
grouped2 = df2.groupby(level='C1', sort=False)

print 'Original Groups'
print grouped.groups
print

print 'Reindexed Groups'
print grouped2.groups
print

print 'Original Group for loop output'
for name, group in grouped:
    print(name)

print
print 'Reindexed Group for loop output'
for name, group in grouped2:
    print(name)

Original DataFrame
  C1 C2 C3
0  B  B  B
1  A  A  A

Reindexed DataFrame
      C3
C1 C2   
B  B   B
A  A   A

Original Groups
{'A': [1], 'B': [0]}

Reindexed Groups
{'A': [('A', 'A')], 'B': [('B', 'B')]}

Original Group for loop output
B
A

Reindexed Group for loop output
A
B

熊貓groupby對多索引排序

問題描述

2 個解決方案

解決方案1
0 2016-04-23 14:23:25

解決方案2
0 2016-04-23 14:36:35

熊貓groupby對多索引排序

問題描述

2 個解決方案

解決方案1 0 2016-04-23 14:23:25

解決方案2 0 2016-04-23 14:36:35

解決方案1
0 2016-04-23 14:23:25

解決方案2
0 2016-04-23 14:36:35