如何在数据帧 r 中查找特定行的索引

Question

我有一个数据框 A，它看起来像这样：

col 1   col2   col3
 NL      6       9
 UK      5       5
 US      9       7

我有一个数据框 B，由大数据框的行的子集组成，如下所示：

 col 1   col2   col3
 NL      6       9
 UK      5       5

现在，我想从 A 中的 B 中找到行的索引，因此它应该返回1 and 2 。 有人知道怎么做吗？

编辑接下来，当我在 B 中只有前两列时，我还想找到 A 中行的索引。所以，在这种情况下，它也应该返回1 and 2 。 任何人都知道如何做到这一点？

Answer 1

通常， match获取索引。 在我们的例子中，一种方法是将行paste在一起并获得match的索引

match(do.call(paste, df2), do.call(paste, df1)

如果只有具有相同列名的列子集，请使用intersect获取列名的向量，对数据集进行子集化，进行paste并获取match的索引

nm1 <- intersect(names(df1), names(df2))
match(do.call(paste, df2[nm1]), do.call(paste, df1[nm1]))

另一种选择是join ，我们在两个数据集中创建行索引，进行连接并提取行索引

 library(dplyr)
 df2 %>%
    mutate(rn = row_number()) %>% 
   left_join(df2 %>% 
          mutate(rn = row_number()), by = c('col1', 'col2', 'col3')) %>% 
   pull(rn.y)

如何在数据帧 r 中查找特定行的索引

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-04-15 16:00:59

如何在数据帧 r 中查找特定行的索引

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-04-15 16:00:59

解决方案1
1 已采纳 2019-04-15 16:00:59