cost 83 ms
在列包含 R 中的特定值的条件下,如何从具有多列的表中获取整个列 - How to get an entire column from a table with multiple columns on a condition that the column contains a specific value in R

我在 R 中有一个简单的表,其中包含 3 列(名为“countries_A”、“countries_B”和“countries_C”),每列包含 4 个国家/地区。 现在我想做的是编写一个 function 在表中搜索特定国家,比如“意大利”,然后返回该国家所在列的所有元素作为向量或列表(除了那个特 ...

R:大向量的高效迭代子集和过滤 - R: Efficient iterative subsetting and filtering of large vector

我想更快地执行以下操作。 逻辑:我有big包含 4 个元素1, 2, 3, 4的向量。 我还有一个相同长度的阈值向量1.1, 3.1, 4.1, 5.1 。 我希望每个元素找到第一个下一个元素的索引高于相应的阈值。 在这种情况下,我预期的 output 是 2, 3, NA, NA : 第一个元素( ...

如何在不导入所有函数的情况下在包中使用 data.table? - How can I use data.table in a package without importing all functions?

我正在构建一个 R 包,我想在其中使用dtplyr来执行各种数据操作。 我的问题是dtplyr似乎只有在我导入整个data.table (即使用 roxygen #' @import data.table ) #' @import data.table 。 没有这个,我会收到如下错误: 如果我可 ...

如何在不将其转换为 dataframe 或 tibble 的情况下使用 dtplyr / data.table 进行 ggplot? - How to ggplot using dtplyr / data.table without converting it into dataframe or tibble?

我第一次尝试dtplyr & data.table在我现有的dplyr代码中做一些时间优化。 问题:如果我使用data.table / dtplyr数据 object 那么我无法使用 ggplot plot 。 在管道/链命令中绘图之前,如果我只是将data.table / dtplyr ...

semi_join 和 anti_join 函数创建 dtplyr 对象而不是数据帧 - semi_join and anti_join functions creating dtplyr objects instead of data frames

所以我正在做一个项目,该项目需要我将数据帧与来自 dplyr 的 semi_join 和 anti_join 结合起来。 但是,我没有创建一个 data.frame 作为 output,而是得到一个 dtplyr_step_subset object,我无法使用它,我不知道它是如何工作的。 (请注 ...

R:尝试应用 lazy_dt 以使用 dtplyr 时出现 env_get_list 错误 - R: Getting env_get_list error when trying to apply lazy_dt in order to use dtplyr

我正在尝试在 R Shiny 中创建仪表板。 作为此仪表板的一部分,我有一个非常大的数据集,其中有一个反应性添加的列,而该数据集的三个反应性子集是通过在不同日期进行过滤产生的。 到目前为止,我已经通过 dplyr 并使用过滤器和变异函数实现了上述目标。 但是,我注意到代码中的这些点似乎在减慢它的速度 ...

tidyverse 中的非 equi 连接 - Non-equi join in tidyverse

我想知道是否有人知道dplyr扩展包( dbplyr和dtplyr )是否允许在通常的 dplyr 工作流程中进行非 equi 连接? 我很少需要data.table ,但快速非等连接是我总是需要setDT的唯一时刻,然后执行连接,然后使用as_tibble()切换回来。 我浏览了 github 包 ...

使用 dtplyr 时,pivot_longer 会出错 - pivot_longer gives error when using dtplyr

我有一个大型数据集,我正在尝试使用 dtplyr 进行整理。 它由用于不同位置的大量(>1000)日期值对组成。 原版使用 pivot_longer,它在 dplyr 中工作正常,但在 dtplyr 中出现错误。 有没有办法解决这个问题,保持 dtplyr 的性能优势? 这有效 但这给出了错误 ...

基于重复的连续行条目创建新列 - Creating new column based on repeated consecutive row entries

想象一下以下数据框的片段: 我想要做的是根据ActivityName 中的重复条目创建两个新列。 具体来说,我想将同一活动的两个后续行合并为一行,并带有开始和完成时间戳(从时间开始,以秒为单位)。 鉴于并非ActivityName中的所有条目都有匹配的第二个条目(但是,最多两个连续条目是相同 ...

根据以前的值更新列值(一次处理总是处理) - Updating column values based on previous values (once treated always treated)

我想知道是否有更快的方法使用 data.table/dplyr 按组替换基于先前值的值。 假设我的原始数据表如下所示: 这看起来如下: 在这里,对于每个人(姓名)和时间段(年),有一列(治疗)指示他们是否已被分配治疗。 我正在考虑另一种治疗方法,即一旦一个人接受治疗,该人就会继续接受治疗 ...

Select 与 dtplyr 冲突列连接后 - Select after a join with conflicting columns with dtplyr

如果我运行以下简单示例,我会得到预期的 output: 请注意,使用添加.x和.y后缀的标准dplyr格式正确管理冲突的列a 。 但是,如果我现在尝试删除其中一列: 有趣的a ,如果我尝试 select 列之一( select(ax) ),我会得到同样的错误,但是......如果我改为尝试selec ...

2019-11-19 16:31:33   3   116    r / dplyr / dtplyr  

排序:
质量:
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM