簡體   English   中英

為具有定性數據的多元回歸 model 構建矩陣

[英]Build a matrix for a multi regression model with qualitative data

我正在嘗試使用定性數據構建多元回歸 model。

為此,我需要構建一個新的數據框,該數據框創建一個新的數據框,其中包含基於唯一值的列,如果索引具有該值,則標記為 1。

例子:

d = {'City': ['Tokyo','Tokyo','Lisbon','Tokyo','Madrid','Lisbon','Madrid','London','Tokyo','London','Tokyo'], 
     'Card': ['Visa','Visa','Visa','Master Card','Bitcoin','Master Card','Bitcoin','Visa','Master Card','Visa','Bitcoin'],
     'Client Number':[1,2,3,4,5,6,7,8,9,10,11],
     }

d = pd.DataFrame(data=d).set_index('Client Number')

並得到等於這個的結果

在此處輸入圖像描述

讓我們試試get_dummies

df = pd.get_dummies(d,prefix='', prefix_sep='')
Out[202]: 
               Lisbon  London  Madrid  Tokyo  Bitcoin  Master Card  Visa
Client Number                                                           
1                   0       0       0      1        0            0     1
2                   0       0       0      1        0            0     1
3                   1       0       0      0        0            0     1
4                   0       0       0      1        0            1     0
5                   0       0       1      0        1            0     0
6                   1       0       0      0        0            1     0
7                   0       0       1      0        1            0     0
8                   0       1       0      0        0            0     1
9                   0       0       0      1        0            1     0
10                  0       1       0      0        0            0     1
11                  0       0       0      1        1            0     0

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM