我将以下数据集加载到 RStudio 中: 数据集我正在尝试创建一个名为“betaplasma_calories_males”的新变量/列。 新变量/列应包括: 列 Betaplasma + 列卡路里但只有性别(性别)男性的实例应该是新列中的输出。 我一直在尝试运行 mutate 命令但没有成功: ...
我将以下数据集加载到 RStudio 中: 数据集我正在尝试创建一个名为“betaplasma_calories_males”的新变量/列。 新变量/列应包括: 列 Betaplasma + 列卡路里但只有性别(性别)男性的实例应该是新列中的输出。 我一直在尝试运行 mutate 命令但没有成功: ...
我有一张看起来像这样的桌子: 命令可乐 B列 1个 A 2,3,4,5 2个 A 3,5,6,7,8 3个 A 1,2,4,9 4个 A 3,5,7,11,12 我想按 A 列汇总此表。output 应如下所示: 命令可乐 B列上校 C 1个 A 2,3,4,5 2,3,4,5 ...
我有一张看起来像这样的桌子: 可乐列b A 2,3,4,5 A 3,5,6,7,8 b 1,2,4 b 3,5,7 我想按 A 列汇总此表。output 应如下所示: 可乐列b A 2,3,4,5,6,7,8 b 1,2,3,4,5,7 请指导我如何在 R 中获得理想的 ou ...
我有一个像这样的长格式数据集: ID 年地址分类 1个 2020 A 北美 1个 2021年 A 北美 1个 2022年乙 B_ 2个 2020 C 北美 2个 2021年丁北美 2个 2022年 F F_ 3个 2020 G 北美 3个 2021年 G 北美 3个 2022年 G ...
我有一个名为“ sim ”的大数据框,它有一个名为“ CAUSABAS ”的字符列,如下所示: 此 data.frame 是使用 package microdatasus创建的,如下所示: 我想创建以下列: grupo_causa_basica ,对这些CAUSABAS进行分类。 一些观察有 3 个 ...
我有一个数据框,每个组的行数不相等,请参见下面示例中的df 。 我想在所有其他列中添加包含组名和 NA 的行,以便每个组的行数与df.desired中的相同。 这些行应添加到相应组的最后一行之后。 例子: 我知道如何使用循环来执行此操作,但这会非常慢,如果可能的话,我更愿意使用dplyr 。 有人 ...
我正在尝试用特定名称 ( Description ) 连续替换两个值Value和Value1 。 现在我希望从代码中,首先找到 Description 列中值为15A的行,然后更改Value列(从 200 到 100)和Value1 (从 300 到 150)中的相应行。 我尝试使用下面的代码,但此 ...
我们如何在不指定列名的情况下对所有列使用dplyr ( tidyverse ) 按行获取第一个非缺失值 -合并? 示例数据: 我们可以使用do.call ,但这看起来不太整洁: 这有效,但我不想指定列: 类似于data.table : 失败的尝试: 有任何想法吗? ...
我知道这已经被讨论过,但找不到适合我的解决方案。 我有几个名为“indic___1”到“indic___8”的二进制 (0/1) 变量和一个连续变量“measure”。 我想计算每个组中“度量”的汇总统计数据,因此我创建了以下代码: 它返回一个错误: ...
所以,我遇到的问题是,我正在尝试将在我看来以科学计数法表示的一系列数字(比如 1.39+e14)转换为应该表示年龄的单个数字,范围从 9 到 18。 我的代码如下: 但是,我不断收到此错误: 我真的不明白这里发生了什么。 任何帮助将不胜感激! ...
我希望开发一个tab(x, y) function 或tab(x, y, d) (其中 d = data.frame)来替换此命令:d <- mtcars d |> dplyr::select(cyl, vs) |> table() 我尝试:d <- mtcars tab ...
我试图在 R 中抓取待售公寓列表和该网站的基本信息(地址、m2、价格、房间等): https://www.boligsiden.dk/tilsalg/ejerlejlighed?sortAscending= true&priceMin=3000000&priceMax=7000000 ...
我正在尝试对一个数据集进行荟萃分析,其中多个作者进行了多项研究,这可能会导致偏差。 因此,我想提取所有可能的行组合,其中任何Author都出现一次。 样本数据: 并希望提取每个作者出现一次的所有可能的行组合(在本例中为 4 种可能性)。 最后,我将对这 4 个不同的提取数据帧进行分析,但我不知道如何 ...
如果我有一个 df 并想做一个分组 ID,我会这样做: 以下( 如何创建@Ronak Shah 的连续组号答案)。 现在我有了这些 dfs 的列表,并想给出连续的组号,但它们不应在每个新的列表元素中开始。 换句话说,listelement 中的 ID 列是 1 到 10,而在 list two 中 ...
两个大的现实生活表加入,但这里有一个小代表: 我有一个小字符串表,我想在第二个表上进行左连接,连接基于是否可以在第二个表的较大字符串中找到这些小字符串。 似乎str_detect()调用和left_join()调用可能是解决方案的一部分——即我希望得到类似的东西: 我正在使用 dplyr 1.1 所 ...
假设我有一个数据框如下: 日期价格公司 2000-10-01 18 A 2001-10-01 20 A 2001-10-01 20 A 2001-10-01 20 A 我想创建一个新变量lagged_price如下: 日期价格公司滞后价格 2000-10-01 18 A ...
我正在寻找生成纵向数据集。 我已经生成了我的拍号和治疗组: 我的时间点(以天为单位)是: 我如何使用向量timepoint_days pivot 这个数据集,所以我有每个参与者 10 行和列名Pat_TNO , trt , timepoint_days 。 ...
我正在生成一些数据,如下所示: 这给了我一张像这样的表: 我想将 pivot 转换成更长的格式,所以我有以下列: timepoints_days 、 timepoints_window 、 arm 、 mean 、 sd 、 n ,有效地将mean_a 、 mean_b旋转到列arm 、 mean ...
我有一个命名的函数列表,其中names(transform_functions)对应于列名,函数是应用于每个特定列的转换。 例如,在下面的示例中, transform_functions$height是function(x) x+1 ,所以我期望starwars |> mutate(heigh ...
我有两个数据集。 我想根据第一个数据集的“概率”为第二个数据集的每一行分配第一个数据集中的“组”。 我想做的逻辑如下: 按时期和社会演示对第一和第二数据集进行分组。 对于第一个数据集中的每个社会演示概率,从具有相同时期和社会的第二个数据集中随机抽取行数相应地分配一个“组”(有 4 个组) 我的数据集 ...