簡體   English   中英

如何使用 Numpy 通過來自另一個 DataFrame 的因子來縮放 DataFrame 中的列

[英]how to scale columns in a DataFrame by factors from another DataFrame using Numpy

要縮放 DataFrame df 中的每一列(A、B、C):

l1 = [1,2,3]
l2 = [4,5,6]
l3 = [7,8,9]

df = pd.DataFrame([z for z in zip(l1,l2,l3)], columns= ['A', 'B', 'C'])

在 DataFrame 縮放中使用縮放因子:

scaling = pd.DataFrame(dict(id=['B', 'A','C'], scaling = [0.2, 0.3, 0.4]))

使用 Numpy:

df = pd.DataFrame(np.array(df)*np.array(scaling['scaling']), columns=df.columns)

如何使用 Numpy 從對應的 id ['B', 'A','C'] 縮放中獲得正確的因子?

我希望使用 print(df) 得到以下結果

   A    B    C
0  0.3  0.8  2.8
1  0.6  1.0  3.2
2  0.9  1.2  3.6

嘗試類似:

import pandas as pd

l1 = [1, 2, 3]
l2 = [4, 5, 6]
l3 = [7, 8, 9]

df = pd.DataFrame([z for z in zip(l1, l2, l3)], columns=['A', 'B', 'C'])

scaling = pd.DataFrame(dict(id=['B', 'A', 'C'], scaling=[0.2, 0.3, 0.4]))

# Get Scaling Into a more Usable Format
scaling = scaling.set_index('id').reindex(df.columns).to_numpy().reshape(1, -1)

# Perform scaling
scaled_df = df * scaling
print(scaled_df)

目標只是將scaling為可以輕松應用於 DataFrame scaling的形狀。 一旦縮放處於正確的形狀和順序:

   scaling
A      0.3
B      0.2
C      0.4
[[0.3 0.2 0.4]]

它可以乘以df

     A    B    C
0  0.3  0.8  2.8
1  0.6  1.0  3.2
2  0.9  1.2  3.6

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM