[英]Compute forward difference with Dask DataFrame?
如何使用Dask DataFrame计算第一个离散差异? 或者,在“Pandas speak”中,我如何在Dask中执行pandas.DataFrame.diff()
? 在数学上,操作非常简单:从移动了一行或多行的自身副本中减去列向量。
我尝试用以下方式在Dask中实现diff()
,其中没有一个工作(还):
df - df.shift(periods=1)
适用于Pandas。 但是Dask DataFrame没有shift()
方法。 df.values[:-1] - df.values[1:]
适用于熊猫。 但我无法看到如何按位置索引到Dask DataFrame。 我目前用于实现diff
最佳想法是在dask.dataframe.rolling.wrap_rolling
包装一些自定义代码, 如此堆栈溢出答案中所建议的那样(尽管我无法找到有关如何执行此操作的任何文档)。 或者使用Dask Delayed包装一些自定义代码? 还有其他想法吗?
diff
方法现已添加到DataFrame和Series中,在此PR中: https : //github.com/dask/dask/pull/1769 。 与熊猫一样工作。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.