根据pandas数据框列的匹配索引，根据满足条件分配随机值

Question

我正在尝试在 python 中填充数据。

代码如下。

代码的目的是在范围内选择一个随机值，并根据数据框列的大小填充熊猫的变量。 为了实现解决方案，如果满足条件，我在 for 循环中定义索引和项目变量，然后在新变量位置的循环变量的索引处添加随机值

import scipy.stats as stats
for index , item in df['RangeCategory']:
    if (item ==  'RC1' ):
        upperLim = 0.5
        lowerLim = 50.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC2' ):
        upperLim = 50
        lowerLim = 250.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC3' ):
        upperLim = 250
        lowerLim = 300.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC4' ):
        upperLim = 300
        lowerLim = 500.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC5' ):
        upperLim = 500
        lowerLim = 900.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC6' ):
        upperLim = 900
        lowerLim = 1500.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC7' ):
        upperLim = 1500
        lowerLim = 3000.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC8' ):
        upperLim = 3000
        lowerLim = 5000.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC9' ):
        upperLim = 5001
        lowerLim = 9000.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC10' ):
        upperLim = 9001
        lowerLim = 10000.4
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC11' ):
        upperLim = 10001
        lowerLim = 30000
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)
    elif (item ==  'RC12' ):
        upperLim = 31000
        lowerLim = 50000
        df["ItemFlagged"][index] =  random.uniform(upperLim, lowerLim)

数据帧有 100K 数据。 当前问题： “解包的值太多”

我遇到了"Too many values to unpack" 的问题。 你能在这里指导我更正吗？

预期结果：根据满足的条件相应地分配随机值

最好的问候，加布

Answer 1

使用 loc 函数赋值：

for index , row in df.iterrows():
    if row['RangeCategory'] == 'RC1':
        upperLim = 0.5
        lowerLim = 50.4
        df.loc[index,"ItemFlagged"] = random.uniform(upperLim, lowerLim)

Answer 2

这是另一个解决方案，

import random

# define a look up RangeCategory
range_lookup = {"RC1": [0.5, 50.4], "RC2": [50, 250.4]...}

df['ItemFlagged'] = (
    df['RangeCategory'].apply(lambda x: random.uniform(*range_lookup[x]))
)

根据pandas数据框列的匹配索引，根据满足条件分配随机值

问题描述

2 个解决方案

解决方案1
0 已采纳 2020-11-03 13:05:50

解决方案2
0 2020-11-03 13:13:50

根据pandas数据框列的匹配索引，根据满足条件分配随机值

问题描述

2 个解决方案

解决方案1 0 已采纳 2020-11-03 13:05:50

解决方案2 0 2020-11-03 13:13:50

解决方案1
0 已采纳 2020-11-03 13:05:50

解决方案2
0 2020-11-03 13:13:50