Dataframe 列值使用 max() function

Question

我正在尝试创建一个名为“阈值”的列，其中值由计算df['column']/30**0.5确定，但我希望该列的最小值为 0.2。 因此，如果计算值低于 0.2，我希望列值为 0.2。

例如：df['column2'] = (df['column']/30)**0.5或 0.2（以较大的数字为准）。

这是我目前拥有的：

df['Historical_MovingAverage_15'] = df['Historical_Average'].rolling(window=15).mean()
df['Threshold'] = max((((df['Historical_MovingAverage_15'])/30)**0.5), 0.2)

它给了我这个错误：

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

Answer 1

使用numpy.maximum ：

df['Threshold'] = np.maximum((((df['Historical_MovingAverage_15'])/30)**0.5), 0.2)

或具有lower参数的Series.clip ：

df['Threshold'] = (((df['Historical_MovingAverage_15'])/30)**0.5).clip(lower=0.2)

样品：

df = pd.DataFrame({'Historical_MovingAverage_15':[.21,2,3]})
df['Threshold'] = np.maximum((((df['Historical_MovingAverage_15'])/30)**0.5), 0.2)
print (df)
   Historical_MovingAverage_15  Threshold
0                         0.21   0.200000
1                         2.00   0.258199
2                         3.00   0.316228

详情：

print ((((df['Historical_MovingAverage_15'])/30)**0.5))
0    0.083666
1    0.258199
2    0.316228
Name: Historical_MovingAverage_15, dtype: float64

Dataframe 列值使用 max() function

问题描述

1 个解决方案

解决方案1
4 已采纳 2020-04-30 04:16:13

Dataframe 列值使用 max() function

问题描述

1 个解决方案

解决方案1 4 已采纳 2020-04-30 04:16:13

解决方案1
4 已采纳 2020-04-30 04:16:13