繁体   English   中英

如何在 dask 中使用多个条件创建变量?

[英]How to create a variable using more than one conditional in dask?

我想应用类似于 np.select 但使用 dask 函数或属性的东西。

所以我假设您不仅使用 Dask,还使用 ​​Dask-Dataframes。 如果您查看此处的文档: https://docs.dask.org/en/latest/dataframe.html ,您将看到对 Dask 系列的索引被认为是快速的。 所以一个例子

dd[dd.x>3] 

应该可以完美运行。 考虑到基本上使用一个 boolean 指标到 select 指标,我们可以通过使用乘法来扩展示例。 True 由 1 表示,False 由零表示,这意味着True * True的乘积将始终等于 1,而False * TrueTrue * FalseFalse * False将产生零。

dd[(dd.x>3)*(dd.y<10)]

因此应该为您提供您正在寻找的功能。

请注意,当您使用 Dask DataFrames 时,实际结果将仅根据请求生成。 因此,如果您想像这样运行计算,请将.compute链接到您的语句后面

dd[(dd.x>3)*(dd.y<10)].compute()

我希望这有帮助

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM