[英]How to convert Object column into numeric for cluster analysis in Python?
幾乎沒有幾列包含測試值,例如使用的付款方式和使用的折扣類型。 我粘貼的條目很少有一個想法。
Mode_of_payment discount_used
ICICI CREDIT CARD FGShoppingFest
Payback FGShoppingFest,T24Club
CASH FGShoppingFest,BBProfitClub
CASH FGShoppingFest,Payback
ICICI CREDIT CARD FGShoppingFest
CreditNote FGShoppingFest
CASH FGShoppingFest,Payback
CASH FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest
Cash Back FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest,T24Club
CASH FGShoppingFest,Payback
關於這些列的信息-使用的付款方式是什么以及在使用的折扣欄中-產品上可以有單項折扣或多項折扣。
我想從這些列中提取信息,以便可以對其應用聚類。 如何將其轉換為數字數據?
別。 如果您的數據不是數字,請選擇不需要數字變量的方法。
盡管您可以使用偽變量對它們進行編碼,但是大多數聚類算法(例如k均值)都期望連續變量。 您不能僅將符號值轉換為有意義的連續變量。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.