![](/img/trans.png)
[英]Most efficient way of applying a compute-heavy function to a dask dataframe?
[英]Most efficient way of applying a function based on condition
假設我們有一個主字典master_dict = {"a": df1, "b": df2, "c": df3}
。 現在假設我們有一個名為condition_list
的列表。 假設func
是一個 function,它返回一個新字典,該字典具有master_dict
的原始鍵以及潛在的新鍵。
當condition_list
的長度大於 2 時,讓下面的代碼工作的最佳方法是什么:
if(len(condition_list) == 1):
df = master_dict[condition_list[0]]
else:
df = func(master_dict(condition_list[0]))
df = df[condition_list[1]]
你要問清楚。 聲明輸入和output。並嘗試制作一個演示代碼。 無論如何,使用循環。
for i in range(len(condition_list)):
if i==0: df = master_dict[condition_list[i]]
else: df = func(df)[condition_list[i]];
如果“df”是 pandas 的 dataframe,則可以立即應用條件。 搜索“多條件選擇dataframe”
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.