Python-將numpy數組作為列添加到具有不同長度的pandas數據幀

Question

我有一個多列的pandas dataframe df 。 列之一是Col1 ，其中包含浮點值或NaN：

df
+----+------+-----+
| No | Col1 | ... |
+----+------+-----+
| 12 |   10 | ... |
| 23 |  NaN | ... |
| 34 |    5 | ... |
| 45 |  NaN | ... |
| 54 |   22 | ... |
+----+------+-----+

我在Col1運行了一個函數，排除了像這樣的缺失值（ NaN ）：

StandardScaler().fit_transform(df.loc[pd.notnull(df[Col1]), [Col1]])

想象一下結果是一個像這樣的numpy.ndarray：

+-----+
| Ref |
+-----+
|   2 |
|   5 |
|   1 |
+-----+

請注意，此數組的長度與原始列Col1長度不同。

我需要一種將Ref列添加為df的解決方案。 對於Col1為NaN每一行，新列Ref也會獲得NaN 。 所需的輸出如下所示：

+----+------+-----+-----+
| No | Col1 | ... | Ref |
+----+------+-----+-----+
| 12 |   10 | ... |   2 |
| 23 |  NaN | ... | NaN |
| 34 |    5 | ... |   5 |
| 45 |  NaN | ... | NaN |
| 54 |   22 | ... |   1 |
+----+------+-----+-----+

Answer 1

我認為您可以分配給由相同布爾掩碼過濾的新列：

from sklearn.preprocessing import StandardScaler

mask = df['Col1'].notnull()
df.loc[mask, 'Ref'] = StandardScaler().fit_transform(df.loc[mask, ['Col1']])
print (df)
   No  Col1       Ref
0  12  10.0 -0.327089
1  23   NaN       NaN
2  34   5.0 -1.027992
3  45   NaN       NaN
4  54  22.0  1.355081

詳細說明 ：

print (StandardScaler().fit_transform(df.loc[mask, ['Col1']]))
[[-0.32708852]
 [-1.02799249]
 [ 1.35508101]]

Python-將numpy數組作為列添加到具有不同長度的pandas數據幀

問題描述

1 個解決方案

解決方案1
4 已采納 2018-06-14 11:46:10

Python-將numpy數組作為列添加到具有不同長度的pandas數據幀

問題描述

1 個解決方案

解決方案1 4 已采納 2018-06-14 11:46:10

解決方案1
4 已采納 2018-06-14 11:46:10