cost 440 ms
使用数据表和 R 对新组进行分组和重置计数器来计算行数

[英]Count rows by grouping and reset counter on new group with datatable and R

我需要计算数据表获取的每个数据池的行数。 这些要求必须填写周列“周”和“存在”。我有以下数据: 店铺客户年星期存在商店 1 客户 1 2020 202001 真的商店 1 客户 1 2020 202002 真的商店 1 客户 1 2020 202003 真的商店 1 客户 1 2020 ...

根据data.table中的条件用其他数据替换缺失值

[英]replace missing values with other data based on conditions in data table

我正在寻找一种有效的方法来替换data.table中丢失的数据。 当“描述”为“”时,我想将其替换为具有相同 ID 的最新日期的“描述”。 所以对于seqs=3 ,我想用 "Red" 替换 "" 因为seqs=2不是 "" 并且是最新日期。 Seqs=4只会保留“”,因为没有其他 ID。 我正在处 ...

2022-11-24 00:19:24   1   31    r / data.table  
data.table 中的 `unstack()` 是什么?

[英]What is the equivalent of `unstack()` in data.table?

我想使用 data.table 将我的数据的长格式转换为宽格式。通常我使用 unstack unstack() ,但我不知道如何在 data.table 中执行此操作。下面是一个示例。 作为 output,我期望三列和三行。 此外,我不想使用聚合 function,但在 data.table 中我 ...

根据另一个 dataframe 的两个日期汇总行值

[英]summarize row values based on two dates from another dataframe

这是我的数据: 我想通过df1的每个id在行方向date1和date2之间的范围内总结(取平均值) df2的value 。 结果是这样的: ID 日期 1 日期2 价值 id_0001 2017-01-01 2017-01-05 mean(c(1,2,5,5,5)) id_0002 201 ...

rbind 两个数据表并在 R 中创建一个新列

[英]rbind two datatables and make a new column in R

嗨,我有两个代表不同组的数据集: #另一个 dataframe 我需要 rbind df1 和 df2 即使长度不相等,并在最后一个名为“数据集”的第三列中指示它来自哪个数据集: ...

是否有使用动物园 package 的日期扩展 function 的更快替代方案?

[英]Is there a faster alternative to the date extension function using the zoo package?

发布在底部的代码很好地扩展了日期,这些日期表示为 (a) 代码中每个Period_1的经过月数和 (b) 定义为Period_2的 YYYY-MM 格式。 项目 (b) 使用动物园 package as.yearmon() function 来扩展 YYYY-MM 日期。 但是,当我针对预期的 2 ...

R:使用带有 data.table 的列值生成随机数

[英]R: generate random number using column value with data table

我有一个非常大的数据集,并且想生成一个包含随机整数的列,该列的最大值取自另一列。 在基数 R 中,它将是: 我如何使用 data.table 执行此操作,因为我希望它运行得更快? 谢谢! ...

沿着链接值的路径每次都取最低值

[英]Path along linked values taking the lowest value each time

我有一个data.table ,其中包含两列“From”和“To”,如下所示: data.table将始终如上例所示排序,“From”和“To”值从小到大递增。 我需要找到一条从第一个“From”(始终为“1”)到最后一个“To”值的“路径”,但始终选择最低的“To”值。 在上面的例子中,我会有 ...

如何使用 data.table 按组过滤和子集数据?

[英]How to filter and subset data by group using data.table?

在底部运行代码时,我向数据框testDF添加了一个“总计”列。 对于“总计”> 0 的实例,我需要“ID”。所以我在这个例子中寻找的 output 只是 1 和 50,这些 ID 是“总计”> 0 的地方。我如何使用data.table有效地计算它? 请注意,这将运行的实际数据库有数百 ...

2022-11-20 09:13:59   4   48    r / data.table  
从另一列中找到符合条件的最大值

[英]find the max value that fits a criterion from another column

我正在查看一些公共交通时间表数据,并试图找出每辆车在上一站的时间。 数据中没有 vehicle_number,所以我只需要在上一站的数据集中找到当前时间之前的最近时间。 就像是... 有什么想法吗? 非常感谢! ...

R:将一行拆分为多行,再将列拆分为多列

[英]R: Split a row into multiple rows, and then split the column into multiple columns

我陷入了一项看似简单的任务。 想象以下data.table :dt1 <- data.table(ID = as.factor(c("202E", "202E", "202E")), timestamp = as.POSIXct(c("2017-05-02 00: ...

2 个连续的嵌套 for 循环 - 是否可以使用 data.table 进行优化或应用? 新增data.table尝试待优化

[英]2 consecutive nested for-loops - Is it possible to optimize with data.table or apply? Added data.table attempt yet to be optimized

根据这个问题末尾的 dput,我有一个由 data.tables 组成的 data.table。 我使用以下嵌套的 for 循环操作这个 data.table 的 data.tables: 留在 data.table 世界中时,是否有可能重新生成/优化这些 for 循环? apply/mapply ...

如何使用 tidyverse 向 tibble 中所有组的每一列添加额外的行?

[英]How do I add extra rows to each column across all groups in tibble using tidyverse?

如何为数据框中每个组id的所有列(分组变量除外)添加额外的行? 数据: 预计 output: 我可以使用以下方式更改day : 但是我不能适当地使用mutate来为station做这个,因为我不知道如何正确地引用里面的每一列complete 失败的尝试: ...

如何合并两个表,然后使用 data.table 一步制表计数

[英]How to merge two tables and then tabulate counts in one step using data.table

步骤 1.我有两个表,我想根据type class以及number是否介于min_number和max_number之间来合并它们。 第 2 步。然后对于每个class ,我想计算有多少个唯一的id1和有多少个唯一的id2 。 最终想要的 output 是这样的: 我的问题:有没有更快的方法来做到 ...

如何按组确定跨两列和两行的两个日期之间的天数差异?

[英]How to determine difference in days between two dates across two columns and two rows by group?

我希望通过两列和两行的组来确定天数差异。 基本上从结束日减去后续行中的后续开始日,并将差异记录为数据框中的新列,并在识别新组 (ID) 时重新开始。 结果应该类似于下表。 本质上,我想计算结束日期与其左对角线开始日期跨组 (ID) 的差异。 我真的很难过这个。 我不认为我的代码会有帮助。 任何使用 ...

approx 和 map2 的组合出奇地慢

[英]Combination of approx and map2 is surprisingly slow

我有一个如下所示的数据集: value1和value2表示给定年份开始和结束时的金额。 我想为每个 id(即按行)线性插入给定月份的值。 在尝试了较慢的不同选项之后,我目前正在使用来自purrr package 的map2结合来自 base R 的approx 。我使用来自data.table p ...

R data.table 按连续值分组

[英]R data.table group by continuous values

我需要一些帮助来按连续值对数据进行分组。 如果我有这个 data.table 我需要为 a 列中的每个以下相等值创建一个组。 在这组中,我需要 b 列的第一个(也是最小可能)值和 c 列的最后一个(也是最大可能)值。 像这样: 非常感谢您的帮助。 我不是一个人解决的。 ...

根据开始和结束时间查找重叠单元

[英]Finding overlapped units based on start and end times

我想知道对于以下问题是否有有效的data.table解决方案。 假设我有以下数据集: 看起来像: 这里emp是员工id,每个员工轮班的开始时间、持续时间和结束时间由三列给出。 我试图在几分钟内确定每个员工之间的重叠量。 因此,output 应该类似于: 其中列基于全部员工。 我正在寻找 data.t ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM