繁体   English   中英

熊猫切入间隔超参数

[英]pandas cut into intervals hyper-parameters

我试图在一个间隔列上匹配多个数据帧,这是 pd.cut() 函数的结果。 但是,由于 pd.cut() 产生不同的结果,匹配不起作用。

例如:将浮点数系列切割成 [15、16、17、18] 的 bin 时,pd.cut 函数有时会产生以下间隔 -选项 A:

(15, 16], (16, 17], (17, 18]

有时它会按以下间隔生成 -选项 B:

(15.0, 16.0], (16.0, 17.0], (17.0, 18.0]

更改精度等超参数无济于事。 有趣的是,当您按间隔分组时,对于选项 B 结果,分组名称实际上是选项 A - (15, 16], (16, 17], (17, 18]

我应该为 pd.cut() 函数使用哪些超参数?

是的,它有效,一个可能的解决方案是手动为 pd.cut() 间隔添加标签作为图例。

df['a_groups'] = pd.qcut(df.a, q=3, labels=['(15, 16]', '(16, 17]', '(17, 18]'])

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM