R中的子集滞后值

Question

对于给定的数据表，请参见下面的示例，我只想通过Unique_ID为大于2的值保留差异列，而不删除NA行。

My_data_table <- structure(list(Unique_ID = structure(c(1L, 1L, 2L, 2L, 3L,
                   3L, 3L, 4L, 4L, 4L), .Label = c("1AA", "3AA", "5AA", "6AA"),
                   class = "factor"), Distance.km. = c(1, 2.05, 2, 4, 2, 4, 7,
                   8, 9, 10), Difference = c(NA, 1.05, NA, 2, NA, 2, 3, NA, 1, 1)),
                   .Names = c("Unique_ID", "Distance.km.", "Difference"),
                   class = "data.frame", row.names = c(NA, -10L))
My_data_table
Unique_ID Distance(km)  Difference    
1AA        1             NA          
1AA        2.05         1.05          
3AA        2             NA          
3AA        4             2          
5AA        2             NA          
5AA        4             2          
5AA        7             3   
6AA        8             NA
6AA        9             1
6AA        10            1

这是我正在寻找的结果

      My_data_table
Unique_ID Distance(km)  Difference            
3AA        2             NA          
3AA        4             2          
5AA        2             NA          
5AA        4             2          
5AA        7             3

Answer 1

转换为'data.table'（ setDT(df1) ）后，按'Unique_ID'分组， if逻辑矢量（ Difference >= 2 ）的sum大于0，则获取Data.table的子集（ .SD ）其中'差异'是NA或| 它大于或等于2

library(data.table)
setDT(df1)[,  if(sum(Difference >=2, na.rm = TRUE)>0) 
                .SD[is.na(Difference)|Difference>=2], by = Unique_ID]
#     Unique_ID Distance.km. Difference
#1:       3AA            2         NA
#2:       3AA            4          2
#3:       5AA            2         NA
#4:       5AA            4          2
#5:       5AA            7          3

Answer 2

一个dplyr解决方案：

library(dplyr)

df %>%
  group_by(Unique_ID) %>%
  filter(any(Difference >= 2 & !is.na(Difference)))
# # A tibble: 5 x 3
# # Groups:   Unique_ID [2]
#   Unique_ID Distance.km. Difference
#      <fctr>        <dbl>      <dbl>
# 1       3AA            2         NA
# 2       3AA            4          2
# 3       5AA            2         NA
# 4       5AA            4          2
# 5       5AA            7          3

R中的子集滞后值

问题描述

2 个解决方案

解决方案1
3 已采纳 2017-10-18 17:02:07

解决方案2
0 2017-10-18 17:47:17

R中的子集滞后值

问题描述

2 个解决方案

解决方案1 3 已采纳 2017-10-18 17:02:07

解决方案2 0 2017-10-18 17:47:17

解决方案1
3 已采纳 2017-10-18 17:02:07

解决方案2
0 2017-10-18 17:47:17