[英]How to convert Object column into numeric for cluster analysis in Python?
几乎没有几列包含测试值,例如使用的付款方式和使用的折扣类型。 我粘贴的条目很少有一个想法。
Mode_of_payment discount_used
ICICI CREDIT CARD FGShoppingFest
Payback FGShoppingFest,T24Club
CASH FGShoppingFest,BBProfitClub
CASH FGShoppingFest,Payback
ICICI CREDIT CARD FGShoppingFest
CreditNote FGShoppingFest
CASH FGShoppingFest,Payback
CASH FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest
Cash Back FGShoppingFest,T24Club,Payback
Cash Back FGShoppingFest,T24Club
CASH FGShoppingFest,Payback
关于这些列的信息-使用的付款方式是什么以及在使用的折扣栏中-产品上可以有单项折扣或多项折扣。
我想从这些列中提取信息,以便可以对其应用聚类。 如何将其转换为数字数据?
别。 如果您的数据不是数字,请选择不需要数字变量的方法。
尽管您可以使用伪变量对它们进行编码,但是大多数聚类算法(例如k均值)都期望连续变量。 您不能仅将符号值转换为有意义的连续变量。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.