我知道这已经被讨论过,但找不到适合我的解决方案。 我有几个名为“indic___1”到“indic___8”的二进制 (0/1) 变量和一个连续变量“measure”。 我想计算每个组中“度量”的汇总统计数据,因此我创建了以下代码: 它返回一个错误: ...
我知道这已经被讨论过,但找不到适合我的解决方案。 我有几个名为“indic___1”到“indic___8”的二进制 (0/1) 变量和一个连续变量“measure”。 我想计算每个组中“度量”的汇总统计数据,因此我创建了以下代码: 它返回一个错误: ...
需要您的帮助,解决列表过滤、合并和汇总的难题。 我的输入参数: 嵌套列表结构 [p0-n, p1-n, p2-n, q3, q4, q5] n - num 用于过滤和合并的项目(p0 和 p1 和 p2) 如果循环子列表中的三个控制项(p0,p1,p2)都相同,则总结(q3,q4,q5)。 并合并到 ...
在下面的数据集上汇总和分组 function 需要帮助目标是使用 header “名称” 获得所有非空白列的总和使用以下 dput 的数据示例 我试过的代码 汇总的 output (sum) 与实际数字不匹配,公式无法生成给定条件的实际行总和我想要的 output 的粗略样本如下所示,只有两列(np ...
我试图产生每个因子水平的加权总和。 我有四列数据: 如果仅填充第 2 列,则该值获取第 1 列的全部金额。 如果第 2 列和第 3 列被填充,则第 1 列中的值会被分成两半。 如果第 2、3 和 4 列被填充,则第 1 列中的值将被分成三部分。 如果第 2 列和第 4 列被填充, ...
我有一个带有数字变量(“数字”)和几个因子变量(因子 0 和 1(FALSE、TRUE)或 0 到 4(病理状态))的数据框。 我想总结每个组(0 到 1、0 到 4)的“数字”的中位数和 IQR。 有没有办法将这个函数应用到数据集中的每个因子列,而不必一个一个地键入一个变量? 输出: ...
我希望能够按位置(纬度)计算以下数据集的平均“IntakeEnergy”。 我认为我遇到的问题是数据集同时包含数字和字符,这导致 function 不知道如何计算字符串的平均值。 我尝试按纬度对数据进行分组,然后使用以下方法计算其他列的平均值: 但是,这只有在我删除所有字符串列时才会成功。 我对 ...
我正在尝试使用 pandas 重塑数据,但一直很难将其转换为正确的格式。 粗略地说,数据看起来像这样*: 我想重塑数据,使其看起来像这样: 我怎么能go做这个呢? 有没有更好的格式来重塑它? 最终我想对数据做一些分组总结,比如每一步发生的次数,eg 谢谢数据实际上包含制造管道不同阶段的许多日期开始/ ...
我正在尝试制作一个表格,显示N (观察次数)、百分比频率(答案 > 0)以及百分比频率的上下置信区间,我想按类型对其进行分组。 数据示例 预期输出(已填充值): 试图 这有助于获得 N 和百分比频率,但返回错误:“当我在 mean_ci 中添加时,“列的长度必须为 1(汇总值),而不是 3” ...
我正在寻找一种更快的方法来计算具有多个分组变量的组均值,同时排除自己的组值。 一个思想实验是在同一年从同一州的县中找到一个县的平均值(例如价格),不包括自己县的价值。 这是一个玩具数据集。 上面的代码给了我想要的结果,但是当我将它应用于更大的数据集(具有更多分组变量)时,它变得非常慢。 您对如何 ...
tibble::tibble( col1 = c("A","","C","",""), col2 = c("string1 part 1","string1 part 2", "string2 part 1", "string2 part 2", ...
我有一个较大字符串中的(子)字符串位置的data.frame 。 数据包含(子)字符串的开头及其长度。 可以轻松计算(子)字符串的结束位置。 data1 <- data.frame(start = c(1,3,4,9,10,13), length = c( ...
我有一个数据框。 片段是: 我需要将 df1 按y分组并对x求和,但要考虑 y 的顺序。 即我需要在每个新的y之后创建一个新组,并对相应的x求和。 所需的 output 是 如何在 R 中执行此操作? ...
我有一个看起来像这样的表: (“天”列不参与我的偏斜峰度计算,它只是在我的表中) 我想要一个计算按年份分组的偏斜和峰度值的表: 我不知道如何按年份对其进行分组以执行这些计算。 ...
使用包qwraps2我们可以在 HTML 和 Latex 中创建漂亮的汇总表。 也支持具有一组的分组数据data.frames ,但是嵌套组呢? 有没有办法将带有嵌套组的data.frame直接传递给qwraps2::summary_table() ? 或者,有没有办法cbind()两个输出? ...
我想使用dplyr :: summarise_all()和weighted.mean来计算每个组的许多列的加权平均值。 我尝试直接使用匿名函数,但返回错误:“ x”和“ w”必须具有相同的长度。 我知道我可以使用summarise()和weighted.mean,但是以这种方式,我需要指 ...
我正在创建一堆基本的状态报告,其中一件我觉得繁琐的事情是在我的所有表格中添加一行。 我目前正在使用Tidyverse方法,这是我当前代码的一个示例。 我正在寻找的是默认包含几个不同级别的选项。 多次这样做非常繁琐。 我有点想要: 仅供参考 - 如果您熟悉SAS,我正在寻找通 ...
我希望将使用dplyr的客户交易数据框架汇总到每个客户一行。 对于连续变量,这很简单-使用sum / mean等。对于分类变量,我想选择“模式”-即组内最常遇到的值,并跨多个列进行操作,例如: 例如拿表Cus1 并生成表Cus_Summary: 是否有任何可以提供此功能的 ...
说我有一个像这样的数据集: 即 对于每个id,我如何获得foo值的最大重复次数 即 例如,id 2的max_repeat为3,因为其值foo(b)之一重复了3次。 ...
我有一个数据框,其中包含一个包含id的列和包含其他数字的列: 您可能会注意到,每个Id在“Number”列中都有相应的一系列连续数字。 例如: Id 400包含一系列长度为4 {1,2,3,4},另一长度为2 {8,9} 我想为每个Id获取相应系列的平均长度。 在这个例子 ...
在Kara Woo的https://stackoverflow.com/a/26555424/9350837答案的基础上,我希望通过各个组的摘要度量vizCredPrcnt对我的分组df进行排序。 到目前为止,这是我的代码, 这是我得到的错误, range_impl(.d ...