簡體   English   中英

Pyspark中的R公式等效

[英]R formula equivalent in Pyspark

我正在嘗試為下面的R代碼找到等效的Pyspark代碼。

產生滯后變量

car <-
  car %>%
  group_by(Model) %>%
  mutate(Target.1 = lag(Target, 3),Sales.1 = lag(Sales, 3))

有任何想法嗎? 謝謝

我認為使用Window函數應該可以工作,盡管您需要通過以下命令進行排序:

import pyspark.sql.functions as func
from pyspark.sql.window import Window

window = Window.partitionBy("Model").orderBy( ??? )
car = car.withColumn("Target.1", func.lag("Target", 3).over(window))\
    .withColumn("Sales.1", func.lag("Sales", 3))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM