繁体   English   中英

使用Dask DataFrame计算前向差异?

[英]Compute forward difference with Dask DataFrame?

如何使用Dask DataFrame计算第一个离散差异? 或者,在“Pandas speak”中,我如何在Dask中执行pandas.DataFrame.diff() 在数学上,操作非常简单:从移动了一行或多行的自身副本中减去列向量。

我尝试用以下方式在Dask中实现diff() ,其中没有一个工作(还):

  • df - df.shift(periods=1)适用于Pandas。 但是Dask DataFrame没有shift()方法。
  • df.values[:-1] - df.values[1:]适用于熊猫。 但我无法看到如何按位置索引到Dask DataFrame。

我目前用于实现diff最佳想法是在dask.dataframe.rolling.wrap_rolling包装一些自定义代码, 如此堆栈溢出答案中所建议的那样(尽管我无法找到有关如何执行此操作的任何文档)。 或者使用Dask Delayed包装一些自定义代码? 还有其他想法吗?

diff方法现已添加到DataFrame和Series中,在此PR中: https//github.com/dask/dask/pull/1769 与熊猫一样工作。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM