在 R 中选择数据帧的行

Question

Consider the following data set.考虑以下数据集。

id var1 var2
1   A   33
2   B   23
3   A   45
4   A   55
5   B   22
6   A   33
7   B   90
8   A   78
9   B   12
10  A   11

I want to take a random sample (rows) of size 5 and 4 from A and B category, respectively.我想分别从A和B类别中抽取大小为5和4的随机样本（行）。 Can one help me, please?有人可以帮帮我吗？ Thanks!谢谢！

Answer 1

You can use sample :您可以使用sample ：

sample_1 <- sample(df[df$var1 == "A", ]$var2, 5)
sample_2 <- sample(df[df$var1 == "B", ]$var2, 4)

Use replace=TRUE for sampling with replacement.使用replace=TRUE进行替换采样。

Data数据

df <- read.table(text="id var1 var2
1   A   33
2   B   23
3   A   45
4   A   55
5   B   22
6   A   33
7   B   90
8   A   78
9   B   12
10  A   11", header=TRUE)

Answer 2

An option is to split the dataset and use sample in Map一个选项是split数据集并使用Map中的sample

do.call(rbind, Map(function(dat, y)
   dat[sample(seq_len(nrow(dat)), size = y),], split(df, df$var1), c(5, 4)))

data数据

df <- structure(list(id = 1:10, var1 = c("A", "B", "A", "A", "B", "A", 
"B", "A", "B", "A"), var2 = c(33L, 23L, 45L, 55L, 22L, 33L, 90L, 
78L, 12L, 11L)), class = "data.frame", row.names = c(NA, -10L
))

在 R 中选择数据帧的行

问题描述

2 个解决方案

解决方案1
1 2020-07-28 15:21:48

解决方案2
1 2020-07-28 22:21:57

data数据

在 R 中选择数据帧的行

问题描述

2 个解决方案

解决方案1 1 2020-07-28 15:21:48

解决方案2 1 2020-07-28 22:21:57

data数据

解决方案1
1 2020-07-28 15:21:48

解决方案2
1 2020-07-28 22:21:57