标签[cumsum] - 堆栈内存溢出

Python Pandas groupby有限累计和 - Python Pandas groupby limited cumulative sum

这是我的 dataframe 这是按月计算的累计金额我更需要的是忽略增量，如果它大于 3 或小于 0，就像这样 function 期望的结果是我尝试使用 apply 和 lambda 但不起作用，而且对于大型 dataframe 来说速度很慢。怎么了？有没有更快的方法？ ...

如何计算 Python 中一系列不同日夜的累积覆盖距离 - How to calculate cumulative covered distances over a sequence of different days and nights in Python

我会计算一条鱼在整个研究期间的每个白天和晚上执行的累积覆盖距离。我有这种 dataframe，其中“日期”对应于记录的日期，“覆盖距离”对应于位移测量值（公里），DayNight 表示位移发生在夜间还是白天（日落之后或之前） ): 实际上我尝试使用这两个代码，但它们都计算了所有夜晚和白天的总累积距 ...

行数组的累积和 - cumulative sum of array of rows

我有这个数据框：交易编号天数预测值 12 1个 .001 12 2个 .002 12 1个 .001 12 2个 .002 13 1个 .001 13 2个 .002 13 3个 .002 13 4个 .003 我想根据连续的天数（即前 2 行的 cumsum，下 ...

为每个日期维护默认值 True/False - Maintain a default of True/False for each date

赏金将在 6 天后到期。此问题的答案有资格获得+200声望赏金。 Digital Farmer想让更多人关注这个问题。白天，新的投资可能性被登记，但结果（ lay栏）仅在每天午夜登记。所以让我们假设这个CSV ：clock_now,competition,market_name,lay 2 ...

如何根据直到前一天而不是每行的结果在块中进行累积和？ - How to make a cumulative sum in blocks with results according to until the day before instead of each line?

我的 CSV 示例：clock_now,competition,market_name,back,lay 2022/08/09,South African Premier Division,Over/Under 0.5 Goals,0.28985,-1.0 2022/08/12,South Afr ...

Groupby sum vs cumsum - 返回 dataframe vs series - Groupby sum vs cumsum - returns dataframe vs series

我注意到当我们对groupby进行dataframe它sum时，我们得到一个完整的dataframe作为回报：但是当我做一个cumsum时，它只返回结果累积系列。为什么他们的行为不同？我怎样才能使cumsum与分组的dataframe一起返回而不分配回来？编辑：我认为这将是一个简单的修复， ...

Dataframe 条件累计和 - Dataframe conditional cumulative sum

我正在尝试根据 2 个分类列值对值列求和。我现在正在尝试根据 A 列和 E 列获取 D 列的总和，即cumsum 、A0E1、A1E0 等应该在 F 列中具有这样的累积总和。 ...

Pandas：有条件的，groupby，cumsum - Pandas: conditional, groupby, cumsum

我有 dataframe，我正在尝试创建一个新列来显示带有条件 groupby 的值。状况： tag == 1, 利润 - 成本标签 > 1，-（成本） net 在每次迭代后求和原始DF： output 希望获得：我可以使用 loc 来导出“if”条件，但是，我无法为此找出或找到 ...

当使用 Pandas 的累积和时，如何填补空白并分配值？ - How to fill the gaps, and assigne the values, when using cumulative sum with Pandas?

我有以下数据集（更大，这只是其中的小样本）：年份应该在 1950 到 2023 之间，我想为每个缺失的城市填充年份：如果城市在开始年份（1950 年）有投票权，则使用该值如果城市在开始年份（1950 年）没有投票，则使用 0 作为开始对于每个城市，我想用下一个逻辑来填补缺失的年份：始终使用前一 ...

pandas 上不同时期的每一行的 cumsum - cumsum for each row according to different period on pandas

如何获得“expected_column”？ dataframe 是按时间排序的值，如何按“ID”列计算每个行组的最后“n”行的总和，“滚动”列中的 n 值。一个 ID 始终具有相同的滚动，2 个 ID 可以具有相同的滚动。 ...

Pandas cumsum 按块 - Pandas cumsum by chunk

在数据集中，我有两列 N：标识每一行的ID号指示符：它是 0 或 1。我想获得什么： Cumsum：计算列 Indicator 的累积 cum，但仅限于 1 的连续值。 Total：然后对于非空值的每个块，获取每个块的非空值的总和（或总和的最大值，或最后一个值）如何有效地获取这两列？（行 ...

R：累积和直到某个值 - R: cumulative sum until certain value

我想计算在累积达到某个值之前取了多少个值。这是我的向量： myvec = seq(0,1,0.1) 我开始编写累积和函数的代码：现在，随着极限不幸的是错误： ...

R如何在满足条件时开始按组计数 - R How to count by group starting when condition is met

当满足条件q_result==1并为每个新id重置时，获取开始计数的count列的方法是什么？ ...

data.table 中组的第一个元素的累积和 - Cumulative sum across first element of groups in data.table

我每隔半小时进行一些时间序列温度测量。我想计算平均累积生长度天数样式指标。我正在使用变量“datetime”，但为了简单起见，省略了实际的日期时间。也不要担心这是否真的是生长度日的正确计算，事实并非如此。以下玩具数据模拟了挑战。现在我计算“每日”平均值：现在我想要做的是计算T_mean_ ...

如何最好地计算总数中的这个份额 - how best to calculate this share of a total

以下是示例数据。目标是首先创建一个列，其中包含该季度的总就业人数。其次是创建一个新列，显示该区域的相对份额。最后，最后一项（也是令我烦恼的一项）是计算 suppress = 0 的总数是否超过总数的 50%。我可以在 excel 中轻松做到这一点，但在 R 中尝试做到这一点，所以我可以年复一 ...

在投资历史中，如何找到被证明长期更可靠的累计金额选项？ - Among investment histories how to find the cumulative sum option that proves to be more reliable for the long term?

事实上，做累计总和时，并不总是达到正值最高峰值的图表对长期投资来说是最可靠的，因为单笔投资可能产生了非常高的利润，但随后又回到了负值的正常状态如果变成无尽的坠落。出于与上述相同的原因，依赖更高的 ROI（投资回报率）也是有风险的。也就是说，这些测试值生成的累积和图是：ex_csv_1 = "" ...

如何在 DataFrame 分析所有可能的组合列而不是仅一起分析所有列时进行累计？ - How to do a cumulative sum in a DataFrame analyzing all possible combination columns instead of analyzing only all columns together?

如果我们想知道['Col 1','Col 2','Col 3']列中的累积总和是否长期有利可图，我们可以这样做：import pandas as pd import io ex_csv = """ Col 1,Col 2,Col 3,return a,b,c,1 d,e,f,1 a,e,c,-1 ...

Pandas groupby累计和从0开始 - Pandas groupby cumulative sum start from 0

我有以下 pandas DataFrame（没有最后一列）：我想添加最后一列作为未出现约会的累计总和（每个人之前未出现的总和）。对于名为 (previous-missed-appointments) 的新列中的每个人，它应该从 0 开始。以下是更容易重现的数据： df = pd.DataFra ...

过滤、迭代、累加、添加到数据框 - Filter, iterate, , cumsum, add to dataframe

我有以下数据框：我正在寻找：通过 a (x,y,z) 列中的（循环）过滤每个值。然后获取 col b 中值的累积和，对于那些过滤值（x 是第一个）所以 x, b 的累加和为：将该累积和添加到另一个 df，我将在其中进行额外计算对 col a 中的下一个值 y 重复该过程。哪个是y，b： ...

如何将样本大小和记录数添加到y标签ggplot - How to add sample size and number of records to y labels ggplot

我有一个数据集，其中有每月和每个地点的物种目击记录，我正在使用 ggplot2 绘制一些丰度图。我想在 y 轴上添加采样总数和目击总数。假设站点 A 在不同日期进行了 5 次采样：我希望 ggplot 在 y 轴上显示如下内容： A (5,17) 表示位置 A (N=5) 的采样总数和这 5 ...