cost 25 ms
与数据表中的 j 相同会导致奇怪的结果

让我们保持简单。 我有以下 DT: 给出: 但为什么? 第二行的总和不应该等于18吗? 如果我先使用: 我们得到 很明显,第二个 b 组的 b 总和应该是 18。我错过了什么? 注意:我并不是说这个命令有多大意义,但我现在正试图理解它。 ...

2022-06-30 21:40:37 1 68
使用来自其他列的中断值将函数剪切应用于一列

假设我有这个数据库: 我想添加另一列,在其中我对一列中的值进行分类(即列调用“val”),按在其他两列中的值之间创建的相等大小的箱(即,列之间的间隔调用 Min 和 Max . 我以为我可以只使用定义为中断 Min 和 Max 列之间的序列的 cut 函数,但它不起作用。 知道如何定义每行 ...

2022-06-30 17:30:00 1 28
替换 R data.table 中值的更快方法

自从我编写 R 代码以来已经有一段时间了,我现在正试图与 data.table 相处。 现在我有一个 data.table (来自变体调用),我想用单词替换一些值。 我认为 fcase() 在这里会很好,但我无法让它工作。 这是我的工作代码: 因此,它所做的是将所有 0/0、0|0 替换为“RE ...

2022-06-29 13:46:40 2 76
在R中动态添加excel中的数据表/数据框(到不同的工作表)

请让我知道 R 中是否有任何方法可以根据可用性动态地将数据表/数据框添加到单个 excel 中的不同工作表中。 例如:假设有三个数据表DF1,DF2,DF3,其中DF1将在没有任何条件的情况下可用,但DF2和DF3只有在它们存在时才会动态存储,即如果它们的条件基于c和d 已通过。 我需要将 D ...

2022-06-29 13:40:31 1 28
用 `fread()` 加载 `csv` 文件替换点、逗号和百分比标记

当我们使用fread()和R code used部分中详述的参数(指定分隔符和小数参数)时,我们希望管理csv文件中最初具有三个character列类的列。 R 会话版本是4.2.0并且data.table版本是1.14.2 。 从csv文件输入数据 在R会话中输入数据 使用的 R 代码 ...

2022-06-29 07:46:31 1 50
R data.table 无法识别对作为函数调用传递的输入列的引用

我正在使用 R data.table 语法计算研究队列的最小和最大年龄十年。 将这两个计算编码为单独的 data.table 链有效。 当我将代码转换为函数并将输入和输出列传递给函数时,data.table 会识别对输出列的引用,但不会识别对输入列的引用。 我减少了以下代码以提供示例。 建议? 强 ...

2022-06-28 20:58:05 2 51
如何按组重复对多个变量的分类变量的频率/表的分析

我创建了这个数据框Variable_7101但我想对多个变量重复这个分析。 更具体地说,我有另一个数据框 (df),其中的行包含我要分析的其他变量。 我可以多次手动重复此代码。 但是,我认为这不是最好的形式。 ...

2022-06-28 12:01:39 1 49
当存在与变量同名的列时,在函数中消除变量名称的歧义(data.table)

我有一个带有名为source的变量的函数。 该函数可以正常工作,但如果应用该函数的数据框有一个也名为source的列,则它不起作用。 一个使用 dplyr 和过滤的简单示例:以下两行有效,但它们根据列进行过滤(我想过滤函数中定义的变量名): 以下行工作并正确使用函数中定义的变量: 如何使用 ...

2022-06-28 07:47:39 1 56
lapply 比硬编码慢

我有一个相当大的df 这是硬编码方法的时间: 与lapply : 运行时间差异大的原因可能是什么? ...

2022-06-27 18:38:48 1 99
如何使用 group by 计算 R 中的百分位数?

我有以下数据框: 我想使用以下分组计算此数据框的百分位数: 但是,每当我尝试使用以下代码执行此操作时,我都会收到错误消息: mutate() 中的错误:! 计算百分位数时的问题= 分位数(值,概率 = seq(0, 1, 0.25))。 x 百分位数的大小必须为 1,而不是 5。 ...

2022-06-27 13:44:31 1 60
将行放在列中,并将它们对应的值放在 r 中的行中

我的原始数据框是这种格式: 我想在列中获取日期,在行中获取变量Sun和Soil_moisture并将其命名为metric 。 它们的值应水平放置,如下所示。 它在r中可行吗? 由于 r 不允许数字出现在列标题中,因此我以 d 为前缀 我的示例数据集: 我尝试了dcast函数,但变量S ...

2022-06-27 02:16:02 2 55
滚动汇总以另一个数据帧上的多个变量为条件

我有以下数据示例: 我将在 trap_data 中添加列,这些列总结了气候数据 V1 和 V2 的 N、平均值和总和,以站点和日期为条件。 但是,我希望这些新变量(N、平均值和总和)适用于 trap_data 中指定日期之前的 N 天(这些时间长度是可变的。例如当前 20 天)。 谢谢, ...

2022-06-26 16:55:50 1 57
计算数据表中的方位角(前导)/计算同一表的行之间

我很难理解如何在 data.table 上应用铅 我想计算当前点和下一点之间的方位。 所以基本上计算data.table中当前行和下一行之间的方位。 这是我尝试过的: 我有路线 data.table 接下来我为(下)行创建“lead”data.table 并尝试在两个data.table ...

2022-06-26 10:04:26 1 41
r - 需要一种解决方法来复制引用类中的 data.table

我正在尝试在参考类中复制数据表,但我无法这样做。 这是一个小例子 当我这样做时,我收到以下错误 if (shallow) assign(field, get(field, envir = selfEnv), envir = vEnv) else { : 参数不能解释为逻辑另外:警告消息:在 ...

2022-06-21 17:51:26 1 18
在R中最近的日期加入两个数据框

我有两个数据集,我想根据日期加入。 一个是调查数据集,另一个是不同日期的价格列表。 日期不完全匹配,所以我想加入调查数据集中最近的日期(价格数据是每周一次)。 以下是调查数据集的简短摘要(还有许多其他变量,但这是最相关的两个): ID 实际日期 ...

2022-05-01 21:43:48 2 75
如何在 data.table 中为损坏的时间创建丢失的数据?

这是我的数据样本; 对于每个组( Store和Product列代表一个组)有时会在Date列中出现中断。 我想让它们在Quantity值中丢失。 这是我想要的输出; Note:我的内存空间有限,桌子很大。 因此,无需重新分配的操作(例如使用:=运算符)会更好。 ...

2022-04-13 13:00:22 1 37
只保留每组的最小值[重复]

这个问题在这里已经有了答案: 使用data.table按组对应最大值的子集行1回答 选择每组中最大值的行(17个答案) ...

2022-03-15 11:01:47 2 33
就地加入多列data.table

我需要使用data.table加入 20 多个列,并且我不能使用以下链接中的语法,因为这意味着要多次写入列的名称。 我可以提供一个示例,其中我必须加入 5 列(在我的实际数据中有超过 20 列):- 而且我不想在加入列时写下列的名称,如下所示:- 有什么办法可以像矢量形式一样编写RHS 。 ...

2022-02-21 09:25:22 1 60

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM