簡體   English   中英

如何為每組設置不同的 set.seed() 然后是 sample()

[英]How to set different set.seed() per group and then sample()

我想在分組后從一個 data.frame 的 Min 到 Max 列中采樣任何數字,並且每個組都有不同的種子。 我嘗試了幾種方法,您可以在下面的可重現示例中看到它們,但它們都不起作用。
data.frame 包含四列:

字母- 我的分組變量
種子- 一個動態且特定於組/字母的整數
min - sample() 的最小值
max - 樣本的最大值()

這是一個可重現的示例:

set.seed(123)
data.frame(letter = sample(letters[1:3],20, replace=TRUE)) %>% 
  group_by(letter) %>% 
  summarise(seed = n()) %>% 
  mutate(min = ifelse(letter == "a", 20,
                      ifelse(letter == "b", 40, 60)),
         max = ifelse(letter == "a", 30,
                      ifelse(letter == "b", 50, 70)))  %>%

  group_by(letter) %>%
  # set.seed(seed) %>%  # or mutate(randomNumber = sample(min:max, 1, set.seed(seed))) # these aren't working, but I hope you get my point 
  mutate(randomNumber = sample(min:max, 1))


提前謝謝了!

我建議在最后一行使用purrr包中的pmap

library(tidyverse)

set.seed(123)
data.frame(letter = sample(letters[1:3],20, replace=TRUE)) %>% 
  group_by(letter) %>% 
  summarise(seed = n()) %>% 
  mutate(min = ifelse(letter == "a", 20,
                      ifelse(letter == "b", 40, 60)),
         max = ifelse(letter == "a", 30,
                      ifelse(letter == "b", 50, 70)))  %>%

  group_by(letter) %>%
  mutate(randomNumber = pmap_dbl(list(min, max, seed), function(x, y, z){set.seed(z); sample(x:y, 1)}))


# A tibble: 3 x 5
# Groups:   letter [3]
  letter  seed   min   max randomNumber
  <fct>  <int> <dbl> <dbl>        <dbl>
1 a          5    20    30           21
2 b          7    40    50           49
3 c          8    60    70           63

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM