熊貓的遞歸關系

Question

我有一個DataFrame， df ，在pandas中有系列df.A和df.B ，我正在嘗試創建第三個系列， df.C依賴於A和B以及之前的結果。 那是：

C[0]=A[0]

C[n]=A[n] + B[n]*C[n-1]

這樣做最有效的方法是什么？ 理想情況下，我不必回到for循環。

編輯

這是給定A和B的C的期望輸出。現在只需要弄清楚如何...

import pandas as pd

a = [ 2, 3,-8,-2, 1]
b = [ 1, 1, 4, 2, 1]
c = [ 2, 5,12,22,23]

df = pd.DataFrame({'A': a, 'B': b, 'C': c})
df

Answer 1

您可以使用令人討厭的累積產品和其他向量的拉鏈來對此進行矢量化。 但它不會最終節省你的時間。 事實上，它可能在數值上不穩定。

相反，你可以使用numba加速你的循環。

from numba import njit
import numpy as np
import pandas as pd

@njit
def dynamic_alpha(a, b):
    c = a.copy()
    for i in range(1, len(a)):
        c[i] = a[i] + b[i] * c[i - 1]
    return c

df.assign(C=dynamic_alpha(df.A.values, df.B.values))

   A  B   C
0  2  1   2
1  3  1   5
2 -8  4  12
3 -2  2  22
4  1  1  23

對於這個簡單的計算，這將與簡單計算一樣快

df.assign(C=np.arange(len(df)) ** 2 + 2)

df = pd.concat([df] * 10000)
%timeit df.assign(C=dynamic_alpha(df.A.values, df.B.values))
%timeit df.assign(C=np.arange(len(df)) ** 2 + 2)

 337 µs ± 5.87 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each) 333 µs ± 20.4 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

Answer 2

試試這個：

C[0]=A[0] C=[A[i]+B[i]*C[i-1] for i in range(1,len(A))]

比循環快得多。

熊貓的遞歸關系

問題描述

2 個解決方案

解決方案1
4 已采納 2018-03-18 10:43:27

解決方案2
-1 2018-03-18 10:31:19

熊貓的遞歸關系

問題描述

2 個解決方案

解決方案1 4 已采納 2018-03-18 10:43:27

解決方案2 -1 2018-03-18 10:31:19

解決方案1
4 已采納 2018-03-18 10:43:27

解決方案2
-1 2018-03-18 10:31:19