[英]Values of a Dask Dataframe
有没有办法在不使用计算函数作为熊猫的情况下获取 dask 数据帧的值?
df.values
ddf.compute().values
Dask 使用计算功能很慢,我必须将 dask 数据帧转换为 json 格式,为此我应该获取值。
由于 Dask 适用于大型数据集,因此对完整数据源执行计算没有意义。
我认为你应该通过迭代分区来生成你的 json 文件。
df.npartitions
为您提供分区数。
你可以得到一个特定的分区(例如,n)与df.get_partition(n)
我必须将 dask 数据框转换为 json 格式和
您可能对 Dask 数据帧的.to_json
方法感兴趣
要做到这一点,我应该得到这些值。
这可能不是真的
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.