[英]How to create a variable using more than one conditional in dask?
我想应用类似于 np.select 但使用 dask 函数或属性的东西。
所以我假设您不仅使用 Dask,还使用 Dask-Dataframes。 如果您查看此处的文档: https://docs.dask.org/en/latest/dataframe.html ,您将看到对 Dask 系列的索引被认为是快速的。 所以一个例子
dd[dd.x>3]
应该可以完美运行。 考虑到基本上使用一个 boolean 指标到 select 指标,我们可以通过使用乘法来扩展示例。 True 由 1 表示,False 由零表示,这意味着True * True
的乘积将始终等于 1,而False * True
、 True * False
和False * False
将产生零。
dd[(dd.x>3)*(dd.y<10)]
因此应该为您提供您正在寻找的功能。
请注意,当您使用 Dask DataFrames 时,实际结果将仅根据请求生成。 因此,如果您想像这样运行计算,请将.compute
链接到您的语句后面
dd[(dd.x>3)*(dd.y<10)].compute()
我希望这有帮助
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.