标签[group-summaries] - 堆栈内存溢出

在 dplyr 的循环中引用变量名 - Referencing variable names in loops for dplyr

我知道这已经被讨论过，但找不到适合我的解决方案。我有几个名为“indic___1”到“indic___8”的二进制 (0/1) 变量和一个连续变量“measure”。我想计算每个组中“度量”的汇总统计数据，因此我创建了以下代码：它返回一个错误： ...

合并和总结循环槽嵌套列表中的项目 - Merging and sum up items in looping trough nested lists

需要您的帮助，解决列表过滤、合并和汇总的难题。我的输入参数：嵌套列表结构 [p0-n, p1-n, p2-n, q3, q4, q5] n - num 用于过滤和合并的项目（p0 和 p1 和 p2）如果循环子列表中的三个控制项（p0，p1，p2）都相同，则总结（q3，q4，q5）。并合并到 ...

多列汇总 - Summary of multiple columns

在下面的数据集上汇总和分组 function 需要帮助目标是使用 header “名称” 获得所有非空白列的总和使用以下 dput 的数据示例我试过的代码汇总的 output (sum) 与实际数字不匹配，公式无法生成给定条件的实际行总和我想要的 output 的粗略样本如下所示，只有两列（np ...

使用 tidyverse 在 R 中加权多列的总和 - Weighted sum of multiple columns in R using tidyverse

我试图产生每个因子水平的加权总和。我有四列数据：如果仅填充第 2 列，则该值获取第 1 列的全部金额。如果第 2 列和第 3 列被填充，则第 1 列中的值会被分成两半。如果第 2、3 和 4 列被填充，则第 1 列中的值将被分成三部分。如果第 2 列和第 4 列被填充， ...

一次将 dplyr 函数应用于所有变量 - Applying a dplyr function to all variables at once

我有一个带有数字变量（“数字”）和几个因子变量（因子 0 和 1（FALSE、TRUE）或 0 到 4（病理状态））的数据框。我想总结每个组（0 到 1、0 到 4）的“数字”的中位数和 IQR。有没有办法将这个函数应用到数据集中的每个因子列，而不必一个一个地键入一个变量？输出： ...

按纬度总结包含数字和字符串的Dataframe - Summarizing Dataframe containing numbers and strings by latitude

我希望能够按位置（纬度）计算以下数据集的平均“IntakeEnergy”。我认为我遇到的问题是数据集同时包含数字和字符，这导致 function 不知道如何计算字符串的平均值。我尝试按纬度对数据进行分组，然后使用以下方法计算其他列的平均值：但是，这只有在我删除所有字符串列时才会成功。我对 ...

以日期作为列值重塑数据 - Reshaping data with dates as column values

我正在尝试使用 pandas 重塑数据，但一直很难将其转换为正确的格式。粗略地说，数据看起来像这样*：我想重塑数据，使其看起来像这样：我怎么能go做这个呢？有没有更好的格式来重塑它？最终我想对数据做一些分组总结，比如每一步发生的次数，eg 谢谢数据实际上包含制造管道不同阶段的许多日期开始/ ...

在 dplyr summarise() 中按组计算上下置信区间 - Calculating upper and lower confidence intervals by group in dplyr summarise()

我正在尝试制作一个表格，显示N （观察次数）、百分比频率（答案 > 0）以及百分比频率的上下置信区间，我想按类型对其进行分组。数据示例预期输出（已填充值）：试图这有助于获得 N 和百分比频率，但返回错误：“当我在 mean_ci 中添加时，“列的长度必须为 1（汇总值），而不是 3” ...

使用多个分组变量获取组均值并排除自己的组值 - Get group mean with multiple grouping variables and excluding own group value

我正在寻找一种更快的方法来计算具有多个分组变量的组均值，同时排除自己的组值。一个思想实验是在同一年从同一州的县中找到一个县的平均值（例如价格），不包括自己县的价值。这是一个玩具数据集。上面的代码给了我想要的结果，但是当我将它应用于更大的数据集（具有更多分组变量）时，它变得非常慢。您对如何 ...

合并数据框中的行而不分组 - Combine rows in data frame without grouping

tibble::tibble( col1 = c("A","","C","",""), col2 = c("string1 part 1","string1 part 2", "string2 part 1", "string2 part 2", ...

压缩/汇总 R 中的字符串开始和长度数据 - compress / summarize string start and length data in R

我有一个较大字符串中的（子）字符串位置的data.frame 。数据包含（子）字符串的开头及其长度。可以轻松计算（子）字符串的结束位置。 data1 <- data.frame(start = c(1,3,4,9,10,13), length = c( ...

按列中的相对差异分组（考虑数据的排序方式） - Group by relative difference in a column (accounting for how data is ordered)

我有一个数据框。片段是：我需要将 df1 按y分组并对x求和，但要考虑 y 的顺序。即我需要在每个新的y之后创建一个新组，并对相应的x求和。所需的 output 是如何在 R 中执行此操作？ ...

在 R 中按年份计算偏斜和峰度 - Calculate skew and kurtosis by year in R

我有一个看起来像这样的表：（“天”列不参与我的偏斜峰度计算，它只是在我的表中）我想要一个计算按年份分组的偏斜和峰度值的表：我不知道如何按年份对其进行分组以执行这些计算。 ...

在嵌套组上应用 `qwraps2` - Apply `qwraps2` on nested groups

使用包qwraps2我们可以在 HTML 和 Latex 中创建漂亮的汇总表。也支持具有一组的分组数据data.frames ，但是嵌套组呢？有没有办法将带有嵌套组的data.frame直接传递给qwraps2::summary_table() ？或者，有没有办法cbind()两个输出？ ...

如何解决summarise_all（）中的错误“ x和w必须具有相同的长度”？ - How to fix the error “'x' and 'w' must have the same length” in summarise_all()?

我想使用dplyr :: summarise_all（）和weighted.mean来计算每个组的许多列的加权平均值。我尝试直接使用匿名函数，但返回错误：“ x”和“ w”必须具有相同的长度。我知道我可以使用summarise（）和weighted.mean，但是以这种方式，我需要指 ...

汇总不同汇总级别的数据 - R和tidyverse - Summarize data at different aggregate levels - R and tidyverse

我正在创建一堆基本的状态报告，其中一件我觉得繁琐的事情是在我的所有表格中添加一行。我目前正在使用Tidyverse方法，这是我当前代码的一个示例。我正在寻找的是默认包含几个不同级别的选项。多次这样做非常繁琐。我有点想要：仅供参考 - 如果您熟悉SAS，我正在寻找通 ...

是否有dplyr函数来确定组中最常遇到的分类值？ - Is there a dplyr function to determine the most commonly encountered categorical value within a group?

我希望将使用dplyr的客户交易数据框架汇总到每个客户一行。对于连续变量，这很简单-使用sum / mean等。对于分类变量，我想选择“模式”-即组内最常遇到的值，并跨多个列进行操作，例如：例如拿表Cus1 并生成表Cus_Summary：是否有任何可以提供此功能的 ...

R-分组后，如何获得重复值的最大次数？ - R - After grouping, how do I get the maximum times a value is repeated?

说我有一个像这样的数据集：即对于每个id，我如何获得foo值的最大重复次数即例如，id 2的max_repeat为3，因为其值foo（b）之一重复了3次。 ...

如何对数据帧进行分组并汇总Python中连续数字的子组？ - How to group a dataframe and summarize over subgroups of consecutive numbers in Python?

我有一个数据框，其中包含一个包含id的列和包含其他数字的列：您可能会注意到，每个Id在“Number”列中都有相应的一系列连续数字。例如： Id 400包含一系列长度为4 {1,2,3,4}，另一长度为2 {8,9} 我想为每个Id获取相应系列的平均长度。在这个例子 ...

如何通过组度量的方式在dfyr :: drange中排列组？ - How to dplyr::arrange groups within a df by the mean of group measure?

在Kara Woo的https://stackoverflow.com/a/26555424/9350837答案的基础上，我希望通过各个组的摘要度量vizCredPrcnt对我的分组df进行排序。到目前为止，这是我的代码，这是我得到的错误， range_impl（.d ...