簡體   English   中英

如何在 dask 中使用多個條件創建變量?

[英]How to create a variable using more than one conditional in dask?

我想應用類似於 np.select 但使用 dask 函數或屬性的東西。

所以我假設您不僅使用 Dask,還使用 ​​Dask-Dataframes。 如果您查看此處的文檔: https://docs.dask.org/en/latest/dataframe.html ,您將看到對 Dask 系列的索引被認為是快速的。 所以一個例子

dd[dd.x>3] 

應該可以完美運行。 考慮到基本上使用一個 boolean 指標到 select 指標,我們可以通過使用乘法來擴展示例。 True 由 1 表示,False 由零表示,這意味着True * True的乘積將始終等於 1,而False * TrueTrue * FalseFalse * False將產生零。

dd[(dd.x>3)*(dd.y<10)]

因此應該為您提供您正在尋找的功能。

請注意,當您使用 Dask DataFrames 時,實際結果將僅根據請求生成。 因此,如果您想像這樣運行計算,請將.compute鏈接到您的語句后面

dd[(dd.x>3)*(dd.y<10)].compute()

我希望這有幫助

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM