繁体   English   中英

如何在Python中将对象列转换为数值以进行聚类分析?

[英]How to convert Object column into numeric for cluster analysis in Python?

几乎没有几列包含测试值,例如使用的付款方式和使用的折扣类型。 我粘贴的条目很少有一个想法。

  Mode_of_payment           discount_used
ICICI CREDIT CARD           FGShoppingFest
Payback             FGShoppingFest,T24Club
CASH                FGShoppingFest,BBProfitClub
CASH                FGShoppingFest,Payback
ICICI CREDIT CARD               FGShoppingFest
CreditNote              FGShoppingFest
CASH                FGShoppingFest,Payback
CASH                FGShoppingFest,T24Club,Payback
Cash Back               FGShoppingFest
Cash Back               FGShoppingFest,T24Club,Payback
Cash Back               FGShoppingFest,T24Club
CASH                FGShoppingFest,Payback

关于这些列的信息-使用的付款方式是什么以及在使用的折扣栏中-产品上可以有单项折扣或多项折扣。

我想从这些列中提取信息,以便可以对其应用聚类。 如何将其转换为数字数据?

别。 如果您的数据不是数字,请选择不需要数字变量的方法。

尽管您可以使用伪变量对它们进行编码,但是大多数聚类算法(例如k均值)都期望连续变量。 您不能仅将符号值转换为有意义的连续变量。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM