根据顺序范围 R 组合列

Question

I have two dataframes that I want to combine.我有两个要合并的数据框。

Jak
1
2
3
4
5
6
7
8
9
10


Start    Stop    ID    Info
1        3       Ab    Abacus
7        10      Bc    Because

I want the final dataframe to be:我希望最终的数据框是：

Jak  ID    Info
1    Ab    Abacus
2    Ab    Abacus
3    Ab    Abacus
4
5
6
7    Bc    Because
8    Bc    Because
9    Bc    Because
10   Bc    Because

Where the sequential numbers are matched based on the start and stop columns, and if the sequential number is in that range, add information from the ID and Info columns.根据开始和停止列匹配序列号的位置，如果序列号在该范围内，则添加来自 ID 和 Info 列的信息。

Answer 1

In base you can use merge after you have created a seq from Start to Stop:在base 中，您可以在创建从 Start 到 Stop 的seq后使用merge ：

merge(x, do.call(rbind, Map(data.frame, Jak=mapply(seq, y$Start, y$Stop), ID=y$ID,
  Info=y$Info)), all.x=TRUE)
#   Jak   ID    Info
#1    1   Ab  Abacus
#2    2   Ab  Abacus
#3    3   Ab  Abacus
#4    4 <NA>    <NA>
#5    5 <NA>    <NA>
#6    6 <NA>    <NA>
#7    7   Bc Because
#8    8   Bc Because
#9    9   Bc Because
#10  10   Bc Because

Data:数据：

x <- data.frame(Jak=1:10)
y <- read.table(header=TRUE, text="Start    Stop    ID    Info
1        3       Ab    Abacus
7        10      Bc    Because")

Answer 2

Does this work:这是否有效：

library(dplyr)
library(tidyr)
library(purrr)
df2 %>% mutate(Jak = map2(Start, Stop, `:`)) %>% 
unnest(Jak) %>% select(3:5) %>% right_join(df1) %>% 
arrange(Jak) %>% select(3,1,2)
Joining, by = "Jak"
# A tibble: 10 x 3
     Jak ID    Info   
   <dbl> <chr> <chr>  
 1     1 Ab    Abacus 
 2     2 Ab    Abacus 
 3     3 Ab    Abacus 
 4     4 NA    NA     
 5     5 NA    NA     
 6     6 NA    NA     
 7     7 Bc    Because
 8     8 Bc    Because
 9     9 Bc    Because
10    10 Bc    Because

Data used:使用的数据：

df1
# A tibble: 10 x 1
     Jak
   <dbl>
 1     1
 2     2
 3     3
 4     4
 5     5
 6     6
 7     7
 8     8
 9     9
10    10
df2
# A tibble: 2 x 4
  Start  Stop ID    Info   
  <dbl> <dbl> <chr> <chr>  
1     1     3 Ab    Abacus 
2     7    10 Bc    Because

Answer 3

Assuming the Stop condition in second dataframe is 10 you can use fuzzyjoin假设第二个数据帧中的Stop条件为 10，您可以使用fuzzyjoin

fuzzyjoin::fuzzy_left_join(df1, df2, by = c('Jak' = 'Start', 'Jak' = 'Stop'), 
                           match_fun = list(`>=`, `<=`))

#   Jak Start Stop   ID    Info
#1    1     1    3   Ab  Abacus
#2    2     1    3   Ab  Abacus
#3    3     1    3   Ab  Abacus
#4    4    NA   NA <NA>    <NA>
#5    5    NA   NA <NA>    <NA>
#6    6    NA   NA <NA>    <NA>
#7    7     7   10   Bc Because
#8    8     7   10   Bc Because
#9    9     7   10   Bc Because
#10  10     7   10   Bc Because

根据顺序范围 R 组合列

问题描述

3 个解决方案

解决方案1
2 已采纳 2020-11-17 12:21:23

解决方案2
1 2020-11-17 11:59:44

解决方案3
1 2020-11-17 12:01:24

根据顺序范围 R 组合列

问题描述

3 个解决方案

解决方案1 2 已采纳 2020-11-17 12:21:23

解决方案2 1 2020-11-17 11:59:44

解决方案3 1 2020-11-17 12:01:24

解决方案1
2 已采纳 2020-11-17 12:21:23

解决方案2
1 2020-11-17 11:59:44

解决方案3
1 2020-11-17 12:01:24