根据“类型”列为分类数据估算 Nan

Question

I have dataframe with 2 columns Name and Signal.我有 dataframe 有 2 列名称和信号。 I want to fill nan values in Signal column but it should be done according to its Name.我想在 Signal 列中填写 nan 值，但应该根据其名称来完成。 I want to imputate it with Most frequent value according to its Name.我想根据它的名称用最常见的值来估算它。 For example:例如：

Timestamp   Name  Signal
 2021-01-01  A.     On
 2021-01-02. A      nan
 2021-01-03. A.     On 
 2021-01-01. B.     Off
 2021-01-02. B.     Off
 2021-01-03. B.     nan

For name A nan value of Signal column should be imputated with "On" since it is most frequent value but for Name B it should be filled with Off because it is the most frequent for B.对于名称 A 的 Signal 列的 nan 值应该用“On”进行估算，因为它是最常见的值，但对于名称 B，它应该填充为 Off，因为它是 B 最常见的值。

How can I achieve it?我怎样才能实现它？

Answer 1

df = df.groupby('Name').apply(lambda x: x.fillna(x['Signal'].value_counts().index[0]))

Output: Output：

>>> df
    Timestamp Name Signal
0  2021-01-01    A     On
1  2021-01-02    A     On
2  2021-01-03    A     On
3  2021-01-01    B    Off
4  2021-01-02    B    Off
5  2021-01-03    B    Off

根据“类型”列为分类数据估算 Nan

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-11-26 02:06:12

根据“类型”列为分类数据估算 Nan

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-11-26 02:06:12

解决方案1
1 已采纳 2021-11-26 02:06:12