[英]how to scale columns in a DataFrame by factors from another DataFrame using Numpy
要缩放 DataFrame df 中的每一列(A、B、C):
l1 = [1,2,3]
l2 = [4,5,6]
l3 = [7,8,9]
df = pd.DataFrame([z for z in zip(l1,l2,l3)], columns= ['A', 'B', 'C'])
在 DataFrame 缩放中使用缩放因子:
scaling = pd.DataFrame(dict(id=['B', 'A','C'], scaling = [0.2, 0.3, 0.4]))
使用 Numpy:
df = pd.DataFrame(np.array(df)*np.array(scaling['scaling']), columns=df.columns)
如何使用 Numpy 从对应的 id ['B', 'A','C'] 缩放中获得正确的因子?
我希望使用 print(df) 得到以下结果
A B C
0 0.3 0.8 2.8
1 0.6 1.0 3.2
2 0.9 1.2 3.6
尝试类似:
import pandas as pd
l1 = [1, 2, 3]
l2 = [4, 5, 6]
l3 = [7, 8, 9]
df = pd.DataFrame([z for z in zip(l1, l2, l3)], columns=['A', 'B', 'C'])
scaling = pd.DataFrame(dict(id=['B', 'A', 'C'], scaling=[0.2, 0.3, 0.4]))
# Get Scaling Into a more Usable Format
scaling = scaling.set_index('id').reindex(df.columns).to_numpy().reshape(1, -1)
# Perform scaling
scaled_df = df * scaling
print(scaled_df)
目标只是将scaling
为可以轻松应用于 DataFrame scaling
的形状。 一旦缩放处于正确的形状和顺序:
scaling
A 0.3
B 0.2
C 0.4
[[0.3 0.2 0.4]]
它可以乘以df
:
A B C
0 0.3 0.8 2.8
1 0.6 1.0 3.2
2 0.9 1.2 3.6
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.