[英]Pass multiple column names as input to the parameter index_col using the function dask.dataframe.read_sql_table to create a dask dataframe
[英]How to correctly input dask Dataframe as parameter to a function?
当我将Dask Dataframe作为参数传递时,他正在转换为pandas Dataframe。
print(type(sellout_df))
simulate_sku_predictions(sellout_df.loc[(sellout_df['sku'] == sku) & (sellout_df['store_id'] == store)].compute(), store, sku)
打印=> <class 'dask.dataframe.core.DataFrame'>
输入定义的功能
def simulate_sku_predictions(sellout_sku_df, store, sku):
print(type(sellout_sku_df))
打印=> <class 'pandas.core.frame.DataFrame'>
我不能使用计算和快捷功能。
我是个新手,但是如果“我不必”,我认为在代码中间进行转换是不合适的。
dask.DataFrame.compute()
返回Pandas DataFrame 。 因此,该代码不被传递DASK数据帧到simulate_sku_predictions
。 论据
sellout_df.loc[(sellout_df['sku'] == sku) & (sellout_df['store_id'] == store)].compute()
在将Pandas DataFrame作为simulate_sku_predictions
的参数传递之前,先将其评估。
如果您删除调用compute()
然后sellout_df.loc[...]
将是一个DASK数据框,你可以传递到simulate_sku_predictions
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.