如何合并具有相同索引的多行，每一行在熊猫中只有一个真实值？

Question

I have a pandas dataframe which has the following shape: 我有一个熊猫数据框，其形状如下：

                          OPEN_INT PX_HIGH PX_LAST VOL
timestamp  ticker source     
2018-01-01   AAPL   NYSE         1      NaN    NaN NaN
2018-01-01   AAPL   NYSE       NaN        2    NaN NaN
2018-01-01   AAPL   NYSE       NaN      NaN      3 NaN
2018-01-01   AAPL   NYSE       Nan      NaN    NaN   4
2018-01-01   MSFT   NYSE         5      NaN    NaN NaN
2018-01-01   MSFT   NYSE       NaN        6    NaN NaN
2018-01-01   MSFT   NYSE       NaN      NaN      7 NaN
2018-01-01   MSFT   NYSE       Nan      NaN    NaN   8

In each column for each (timestamp, ticker, source) group there is gurantted only one value, all other values are Nan, is there any way I can combine these into single rows so it looks like: 在每个组（时间戳，行情指示器，源）的每一列中，仅保证一个值，所有其他值均为Nan，是否有任何方法可以将它们组合成单个行，因此如下所示：

                          OPEN_INT PX_HIGH PX_LAST VOL
timestamp  ticker source     
2018-01-01   AAPL   NYSE         1      2        3   4
2018-01-01   MSFT   NYSE         5      6        7   8

I have tried to use df.groupby(['timestamp', 'ticker', 'source']).agg(lambda x: x.dropna() but I got an error saying Function does not reduce . 我尝试使用df.groupby(['timestamp', 'ticker', 'source']).agg(lambda x: x.dropna()但出现错误，提示Function does not reduce 。

Answer 1

Use GroupBy.first : 使用GroupBy.first ：

df.groupby(['timestamp', 'ticker', 'source']).first()

If is always only one value per groups aggregate by max , min , sum , mean ...: 如果总是，则每组中只有一个值通过max ， min ， sum ， mean ...聚合：

df.groupby(['timestamp', 'ticker', 'source']).max()

如何合并具有相同索引的多行，每一行在熊猫中只有一个真实值？

问题描述

1 个解决方案

解决方案1
2 已采纳 2019-01-28 10:12:38

如何合并具有相同索引的多行，每一行在熊猫中只有一个真实值？

问题描述

1 个解决方案

解决方案1 2 已采纳 2019-01-28 10:12:38

解决方案1
2 已采纳 2019-01-28 10:12:38