[英]Insert a series of values into pd.dataframe randomly
我有一个大数据框,我想要做的是用我设置的新值覆盖该数据框的 X 个条目。 新条目必须位于随机位置,但必须按顺序排列。 就像我有一个带有随机数的列,并且想用新值 x 连续覆盖其中的 20 个。
我试过df.sample(x)
然后更新数据df.sample(x)
,但我只得到单个条目。 但是我需要连续的 X 个新条目(连续)。
有人有解决方案吗? 我对 Python 很陌生,必须在我的硕士论文中学习它。
澄清:
我的数据框有 5 列,几乎有 60,000 行,每行一年中的 10 分钟。
我试过:
df_update = df.sample(12)
df_update.status = 'reduced'
df.update(df_update)
df.loc[('status) == 'reduced', ['production']] *=0.6
这对总时间(12 * 10 分钟)有效,但我想要连续 120 分钟而不是分开。
我决定获取一个随机值并将接下来的 12 个条目索引为 0.6。 我想这就是你想要的。
df = pd.DataFrame({'output':np.random.randn(20),'status':[0]*20})
idx = df.sample(1).index.values[0]
df.loc[idx:idx+11,"output"]=0.6
df.loc[idx:idx+11,"status"]=1
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.