簡體   English   中英

如何“乘以” python pandas數據框(就像它們是矢量一樣)?

[英]How to “multiply” python pandas dataframes (as if they were vectors)?

我在學習熊貓。 我有兩個數據框:

df1 = 
quality1  value
A         1
B         2
C         3

df2 = 
quality2  value
D         1
E         10
F         100

我想將它們相乘(就像我可能用向量來得到一個矩陣)。 答案應該是:

df3 = 
quality1    quality2  value
A           D         1
            E         10
            F         100
B           D         2
            E         20
            F         200
C           D         3
            E         30
            F         300

我該如何實現?

它不是最漂亮的,但是可以工作:

>>> df1["dummy"] = 1
>>> df2["dummy"] = 1
>>> dfm = df1.merge(df2, on="dummy")
>>> dfm["value"] = dfm.pop("value_x") * dfm.pop("value_y")
>>> del dfm["dummy"]
>>> dfm
  quality1 quality2  value
0        A        D      1
1        A        E     10
2        A        F    100
3        B        D      2
4        B        E     20
5        B        F    200
6        C        D      3
7        C        E     30
8        C        F    300

直到我們得到笛卡爾連接的本地支持( 吹口哨並移開視線。 ),在虛擬列上合並是獲得相同效果的簡單方法。 中間框架看起來像

>>> dfm
  quality1  value_x  dummy quality2  value_y
0        A        1      1        D        1
1        A        1      1        E       10
2        A        1      1        F      100
3        B        2      1        D        1
4        B        2      1        E       10
5        B        2      1        F      100
6        C        3      1        D        1
7        C        3      1        E       10
8        C        3      1        F      100

您也可以使用scikit-learn cartesian函數:

from sklearn.utils.extmath import cartesian

# Your data:
df1 = pd.DataFrame({'quality1':list('ABC'), 'value':[1,2,3]})
df2 = pd.DataFrame({'quality2':list('DEF'), 'value':[1,10,100]})

# Make the matrix of labels:
dfm = pd.DataFrame(cartesian((df1.quality1.values, df2.quality2.values)), 
                   columns=['quality1', 'quality2'])

# Multiply values:
dfm['value'] = df1.value.values.repeat(df2.value.size) * pd.np.tile(df2.value.values, df1.value.size)

print dfm.set_index(['quality1', 'quality2'])

產生:

                   value
quality1 quality2       
A        D             1
         E            10
         F           100
B        D             2
         E            20
         F           200
C        D             3
         E            30
         F           300

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM