簡體   English   中英

如何在Python中將對象列轉換為數值以進行聚類分析?

[英]How to convert Object column into numeric for cluster analysis in Python?

幾乎沒有幾列包含測試值,例如使用的付款方式和使用的折扣類型。 我粘貼的條目很少有一個想法。

  Mode_of_payment           discount_used
ICICI CREDIT CARD           FGShoppingFest
Payback             FGShoppingFest,T24Club
CASH                FGShoppingFest,BBProfitClub
CASH                FGShoppingFest,Payback
ICICI CREDIT CARD               FGShoppingFest
CreditNote              FGShoppingFest
CASH                FGShoppingFest,Payback
CASH                FGShoppingFest,T24Club,Payback
Cash Back               FGShoppingFest
Cash Back               FGShoppingFest,T24Club,Payback
Cash Back               FGShoppingFest,T24Club
CASH                FGShoppingFest,Payback

關於這些列的信息-使用的付款方式是什么以及在使用的折扣欄中-產品上可以有單項折扣或多項折扣。

我想從這些列中提取信息,以便可以對其應用聚類。 如何將其轉換為數字數據?

別。 如果您的數據不是數字,請選擇不需要數字變量的方法。

盡管您可以使用偽變量對它們進行編碼,但是大多數聚類算法(例如k均值)都期望連續變量。 您不能僅將符號值轉換為有意義的連續變量。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM