[英]Create Panda Df from numpy array
我正在运行下面的np.random.choice。
record = np.random.choice(data, size=6, p=prob)
maxv = max(record)
minv = min(record)
val = record
由此我找到最小和最大。 我想将其加入到熊猫数据框。 以下是我想要的输出:
Min,Max,value
1,5,2
1,5,3
1,5,3
1,5,5
1,5,1
1,5,3
这是我希望从一个模拟中获得的输出示例。 请记住,我多次执行此仿真,因此我希望能够不断添加到创建的数据框中。 每个模拟将分别具有自己的最小值和最大值。 我还想在输出中保留最小值和最大值(为什么示例输出中为1和5)。
我将使用初始数据列“ Val”创建df,然后将新列添加到一个衬里中:
In [242]:
df = pd.DataFrame({'Val':np.random.randint(1,6,6)})
df['Min'], df['Max'] = df['Val'].min(), df['Val'].max()
df
Out[242]:
Val Min Max
0 4 2 5
1 5 2 5
2 5 2 5
3 4 2 5
4 5 2 5
5 2 2 5
这是我解决的方法:
record = np.random.choice(data, size=6, p=prob)
maxv = [max(record)] * len(record)
minv = [min(record)] * len(record)
new_data = zip(minv, maxv, record)
df = DataFrame(new_data, columns=['Min', 'Max', 'val'])
只需遍历仿真并将值附加到数据框即可:
# CREATE DATA FRAME STRUCTURE
df = pd.DataFrame(columns=['Min', 'Max', 'val'])
# RUN SIMULATION IN LOOP ITERATION
record = np.random.choice(data, size=6, p=prob)
for i in range(len(record)):
maxv = np.max(record)
minv = np.min(record)
val = record[i]
# APPEND ROW
df.loc[len(df)] = [maxv, minv, val]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.