[英]pandas cut into intervals hyper-parameters
我试图在一个间隔列上匹配多个数据帧,这是 pd.cut() 函数的结果。 但是,由于 pd.cut() 产生不同的结果,匹配不起作用。
例如:将浮点数系列切割成 [15、16、17、18] 的 bin 时,pd.cut 函数有时会产生以下间隔 -选项 A:
(15, 16], (16, 17], (17, 18]
有时它会按以下间隔生成 -选项 B:
(15.0, 16.0], (16.0, 17.0], (17.0, 18.0]
更改精度等超参数无济于事。 有趣的是,当您按间隔分组时,对于选项 B 结果,分组名称实际上是选项 A - (15, 16], (16, 17], (17, 18]
我应该为 pd.cut() 函数使用哪些超参数?
是的,它有效,一个可能的解决方案是手动为 pd.cut() 间隔添加标签作为图例。
df['a_groups'] = pd.qcut(df.a, q=3, labels=['(15, 16]', '(16, 17]', '(17, 18]'])
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.