如何僅在 Pandas 中將列數據添加到第一行或為新列條目提供默認數據？

Question

不是確切的代碼，而是簡化了：

df['running_total'] = df.running_total.shift() + df['total']

顯然，在第一個實例中df.running_total.shift()條目不存在所以它出錯了。

第一個條目有一個特殊的計算，所以我想明確設置它。 或者，只要無法找到上一個行條目或 DNE，就使用該計算作為默認值。

兩種解決方案都可行，更喜歡更快的解決方案（小數據集，不常調用）。

Answer 1

您可以使用：

df = pd.DataFrame({'running_total':[4,5,np.nan, np.nan]})
print (df)
   running_total
0            4.0
1            5.0
2            NaN
3            NaN

print (df.running_total.shift())
0    NaN
1    4.0
2    5.0
3    NaN
Name: running_total, dtype: float64

一種可能的解決方案是fillna - 但它替換了所有NaN

print (df.running_total.shift().fillna(0))
0    0.0
1    4.0
2    5.0
3    0.0
Name: running_total, dtype: float64

如果只想替換第一個值，請通過iat ( iloc , loc ) 設置它：

shifted = df.running_total.shift()
shifted.iat[0] = 0
print (shifted)
0    0.0
1    4.0
2    5.0
3    NaN
Name: running_total, dtype: float64

如何僅在 Pandas 中將列數據添加到第一行或為新列條目提供默認數據？

問題描述

1 個解決方案

解決方案1
1 2017-10-30 06:00:00

如何僅在 Pandas 中將列數據添加到第一行或為新列條目提供默認數據？

問題描述

1 個解決方案

解決方案1 1 2017-10-30 06:00:00

解決方案1
1 2017-10-30 06:00:00