使用嵌套条件提取data.frame中的行的随机样本

Question

这个问题来自这里发现的SO帖子，并使用从R-help邮件列表上的帖子修改的代码，这里可以看到

我试图在数据框中提取行的随机样本，但使用条件。 使用R iris数据，如下所示：

> head(iris)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa

要获取一个简单的随机样本，下面的代码可以正常处理2行样本。

iris[sample(nrow(iris), 2), ]

但是我不确定如何调节Species字段。 例如，如上所示如何采取随机样本，但仅限于Species != “setosa”

iris$Species有三种类别

> summary(iris$Species)
    setosa versicolor  virginica 
        50         50         50

我不确定如何正确嵌套条件。 我之前的一个尝试是在下面，其中包括明显不正确的结果......

> iris[sample(nrow(iris)[iris$Species != "setosa"], 2), ]
     Sepal.Length Sepal.Width Petal.Length Petal.Width Species
NA             NA          NA           NA          NA    <NA>
NA.1           NA          NA           NA          NA    <NA>

谢谢

Answer 1

我会使用which来获取行数的向量，从中可以根据您的条件进行sample ....

iris[ sample( which( iris$Species != "setosa" ) , 2 ) , ]
#    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
#59           6.6         2.9          4.6         1.3 versicolor
#133          6.4         2.8          5.6         2.2  virginica

Answer 2

使用dplyr：

library(dplyr)
set.seed(12)
filter(iris, Species != "setosa") %>% sample_n(., 2)

输出：

   Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
7           6.3         3.3          4.7         1.6 versicolor
81          7.4         2.8          6.1         1.9  virginica

Answer 3

不在一条线上做得更干净，但是

iris[iris$Species != "setosa",][sample(nrow(iris[iris$Species != "setosa",]), 2), ]

Answer 4

干净简单的数据表方法：

require(data.table)
iris <- data.table(iris)
cond <- iris[Species!= 'setosa', which = T]
iris[sample(cond, 2)]

使用嵌套条件提取data.frame中的行的随机样本

问题描述

4 个解决方案

解决方案1
18 已采纳 2013-11-14 22:29:22

解决方案2
10 2015-07-05 08:41:32

解决方案3
4 2013-11-14 22:07:19

解决方案4
4 2013-11-14 22:25:01

使用嵌套条件提取data.frame中的行的随机样本

问题描述

4 个解决方案

解决方案1 18 已采纳 2013-11-14 22:29:22

解决方案2 10 2015-07-05 08:41:32

解决方案3 4 2013-11-14 22:07:19

解决方案4 4 2013-11-14 22:25:01

解决方案1
18 已采纳 2013-11-14 22:29:22

解决方案2
10 2015-07-05 08:41:32

解决方案3
4 2013-11-14 22:07:19

解决方案4
4 2013-11-14 22:25:01