繁体   English   中英

将Pandas数据帧转换为Dask数据帧

[英]Convert Pandas dataframe to Dask dataframe

假设我有pandas数据帧:

df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6]})

当我将其转换为dask数据帧时, namedivisions参数应该包括:

from dask import dataframe as dd 
sd=dd.DataFrame(df.to_dict(),divisions=1,meta=pd.DataFrame(columns=df.columns,index=df.index))

TypeError: init ()缺少1个必需的位置参数:'name'

编辑 :假设我创建了一个pandas数据框,如:

pd.DataFrame({'a':[1,2,3],'b':[4,5,6]})

类似地,如何创建dask数据帧,因为它需要三个额外的参数作为name,divisionsmeta

sd=dd.Dataframe({'a':[1,2,3],'b':[4,5,6]},name=,meta=,divisions=)

谢谢您的回复。

我想你可以使用dask.dataframe.from_pandas

from dask import dataframe as dd 
sd = dd.from_pandas(df, npartitions=3)
print (sd)
dd.DataFrame<from_pa..., npartitions=2, divisions=(0, 1, 2)>

编辑:

我找到解决方案

import pandas as pd
import dask.dataframe as dd
from dask.dataframe.utils import make_meta

df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6]})

dsk = {('x', 0): df}

meta = make_meta({'a': 'i8', 'b': 'i8'}, index=pd.Index([], 'i8'))
d = dd.DataFrame(dsk, name='x', meta=meta, divisions=[0, 1, 2])
print (d)
dd.DataFrame<x, npartitions=2, divisions=(0, 1, 2)>

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM