[英]How to create a variable using more than one conditional in dask?
我想應用類似於 np.select 但使用 dask 函數或屬性的東西。
所以我假設您不僅使用 Dask,還使用 Dask-Dataframes。 如果您查看此處的文檔: https://docs.dask.org/en/latest/dataframe.html ,您將看到對 Dask 系列的索引被認為是快速的。 所以一個例子
dd[dd.x>3]
應該可以完美運行。 考慮到基本上使用一個 boolean 指標到 select 指標,我們可以通過使用乘法來擴展示例。 True 由 1 表示,False 由零表示,這意味着True * True
的乘積將始終等於 1,而False * True
、 True * False
和False * False
將產生零。
dd[(dd.x>3)*(dd.y<10)]
因此應該為您提供您正在尋找的功能。
請注意,當您使用 Dask DataFrames 時,實際結果將僅根據請求生成。 因此,如果您想像這樣運行計算,請將.compute
鏈接到您的語句后面
dd[(dd.x>3)*(dd.y<10)].compute()
我希望這有幫助
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.