pandas Dataframe 创建新列

Question

我有与 pandas dataframe 一起使用的代码片段，我正在尝试使用应用 function 创建一个名为 STDEV 的新列，该列运行错误

TypeError: ("'float' object is not iterable", 'occurred at index 0')

有人可以帮我理解为什么我不断收到这个错误

def sigma(df):
    val = df.volume2Sum / df.volumeSum - df.vwap * df.vwap
    return math.sqrt(max(val))


df['STDEV_TV'] = df.apply(sigma, axis=1)

Answer 1

尝试：

import pandas as pd
import numpy as np
import math

df = pd.DataFrame(np.random.randint(1, 10, (5, 3)),
                  columns=['volume2Sum', 'volumeSum', 'vwap'])

def sigma(df):
    val = df.volume2Sum / df.volumeSum - df.vwap * df.vwap
    return math.sqrt(val) if val >= 0 else val

df['STDEV_TV'] = df.apply(sigma, axis=1)

Output：

>>> df
   volume2Sum  volumeSum  vwap   STDEV_TV
0           4          5     8 -63.200000
1           2          8     4 -15.750000
2           3          3     3  -8.000000
3           8          3     4 -13.333333
4           4          2     3  -7.000000

Answer 2

改变

return math.sqrt(max(val))

至

return math.sqrt(val)

max()遍历一个可迭代对象并找到最大值。 这里的问题是，由于您将sigma应用于每一行，因此局部变量val是一个浮点数，而不是一个列表，所以您拥有的类似于max(1.3) 。

Answer 3

您需要将 sigma 应用于每组值，而不是整个 DataFrame。 我会使用 lambda function，例如：

def sigma(volume2Sum, volumeSum, vwap):
    val = volume2Sum / volumeSum - vwap * vwap
    return math.sqrt(val)


df['STDEV_TV'] = df.apply(lambda x: sigma(x.volume2Sum, x.volumeSum, x.vwap), axis=1)

这应该将 val 放入 STDEV_TV 列，您可以单独找到最大值。 注意不要取负数的平方根。

Answer 4

结果，您 function sigma 给您一个数字。 因为，第一步你找到最大值：

max(val)

它只是一个数字......之后你尝试使用你的 function 数据系列。 您应该在代码中使用最后一个字符串：

df['STDEV_TV'] = sigma(df)

它会工作

pandas Dataframe 创建新列

问题描述

4 个解决方案

解决方案1
2 已采纳 2021-12-11 23:22:50

解决方案2
0 2021-12-11 23:05:16

解决方案3
0 2021-12-11 23:14:57

解决方案4
0 2021-12-11 23:31:12

pandas Dataframe 创建新列

问题描述

4 个解决方案

解决方案1 2 已采纳 2021-12-11 23:22:50

解决方案2 0 2021-12-11 23:05:16

解决方案3 0 2021-12-11 23:14:57

解决方案4 0 2021-12-11 23:31:12

解决方案1
2 已采纳 2021-12-11 23:22:50

解决方案2
0 2021-12-11 23:05:16

解决方案3
0 2021-12-11 23:14:57

解决方案4
0 2021-12-11 23:31:12