Pandas 不可散列类型：'numpy.ndarray'

Question

df_ppc.info() ：

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 892 entries, 0 to 891
Data columns (total 4 columns):
Player     892 non-null object
Mean       892 non-null object
Team       892 non-null object
Position   892 non-null object

如果我喜欢这样：

df = df_ppc.groupby(['Player'])['Mean'].max().sort_values(ascending=False)

有用。

如果我这样分组：

df = df_ppc.groupby(['Player', 'Team'])['Mean'].max().sort_values(ascending=False)

它抛出：

  File "pandas/_libs/hashtable_class_helper.pxi", line 1798, in pandas._libs.hashtable.PyObjectHashTable.factorize
  File "pandas/_libs/hashtable_class_helper.pxi", line 1718, in pandas._libs.hashtable.PyObjectHashTable._unique
TypeError: unhashable type: 'numpy.ndarray'

为什么？ 我该如何解决？

编辑：

样品表：

        Player        Mean      Team  \
715  Richard Franco   0.2354   Avaí   
12       Alan Costa   0.6543   CSA   
14      Alan Santos   0.0345   Botafogo   

           Posicao 
715  Meio-Campista       
12        Zagueiro         
14   Meio-Campista

df_pcc 是这样构建的：

position = df_players.groupby('Player')['position'].agg(pd.Series.mode)
team = df_players.groupby('Team')['time_nome'].agg(pd.Series.mode)
mean = df_players.groupby('atleta_nome').mean()['points']

df_ppc = pd.DataFrame([team, position, mean]).T

df_ppc.columns = ['Team','Position','Mean']   

df_ppc = df_ppc.reset_index()

Answer 1

构建df_ppc时，只选择第一个模式，因为 function 将返回一系列而不是单个值

position = df_players.groupby('Player')['position'].agg(lambda x : x.mode().iloc[0])
team = df_players.groupby('Team')['time_nome'].agg(lambda x : x.mode().iloc[0])

例如

pd.Series([1,1,2,2]).mode()
Out[24]: 
0    1
1    2
dtype: int64

Pandas 不可散列类型：'numpy.ndarray'

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-07-31 01:13:12

Pandas 不可散列类型：'numpy.ndarray'

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-07-31 01:13:12

解决方案1
1 已采纳 2020-07-31 01:13:12