在数据框列中获取 NaN 而不是正确的值

Question

我使用以下语法创建了一个零数据帧：

ltv = pd.DataFrame(data=np.zeros([actual_df.shape[0], 6]),
                        columns=['customer_id',
                                'actual_total',
                                'predicted_num_purchases',
                                'predicted_value',
                                'predicted_total',
                                'error'], dtype=np.float32)

结果完全符合预期

customer_id | actual_total | predicted_num_purchases | predicted_value | predicted_total | error
0   0.0          0.0             0.0                         0.0              0.0           0.0
1   0.0          0.0             0.0                         0.0              0.0           0.0
2   0.0          0.0             0.0                         0.0              0.0           0.0

当我运行此语法时：

ltv['customer_id'] = actual_df['customer_id']

我在ltv['customer_id']中得到所有 NaN。 是什么原因造成的，我该如何防止它发生？

注意：我还检查了actual_df ，里面没有 NaN

Answer 1

两者都需要相同的索引值（并且两个数据帧的长度也相同）。

所以第一个解决方案是在actual_df中创建默认RabgeIndex ，在ltv中未指定，因此默认创建：

actual_df = actual_df.reset_index(drop=True)
ltv['customer_id'] = actual_df['customer_id']

或者在DataFrame构造函数中添加参数index ：

ltv = pd.DataFrame(data=np.zeros([actual_df.shape[0], 6]),
                        columns=['customer_id',
                                'actual_total',
                                'predicted_num_purchases',
                                'predicted_value',
                                'predicted_total',
                                'error'], dtype=np.float32,
                        index=actual_df.index)

ltv['customer_id'] = actual_df['customer_id']

Answer 2

另一种选择（比 jezrael 的好答案更复杂）是使用pd.concat()后跟.drop() ：

ltv = pd.concat([ltv.drop(columns=['customer_id']),actual_df[['customer_id']]],axis=1,ignore_index=True)

在数据框列中获取 NaN 而不是正确的值

问题描述

2 个解决方案

解决方案1
2 已采纳 2019-11-27 12:55:32

解决方案2
0 2019-11-27 13:00:47

在数据框列中获取 NaN 而不是正确的值

问题描述

2 个解决方案

解决方案1 2 已采纳 2019-11-27 12:55:32

解决方案2 0 2019-11-27 13:00:47

解决方案1
2 已采纳 2019-11-27 12:55:32

解决方案2
0 2019-11-27 13:00:47