繁体   English   中英

如何将随机种子分配给 dplyr sample_n function?

[英]How do I assign a random seed to the dplyr sample_n function?

这是 R 中 dplyr 中的“sample_n”。
https://dplyr.tidyverse.org/reference/sample.html

为了重现性,我应该放置一个种子,以便其他人可以得到我的确切结果。

是否有内置方法来设置“sample_n”的种子? 这是我在环境中所做的事情并且“sample_n”会响应它吗?

这些不是内置在“sample_n”function 中的。

  • 有环境“set.seed” function [1]
  • 有一个库“withr”为代码创建了一个包含种子的包装器[2]

.

dplyr::sample_n文档告诉我们:

这是 sample.int() 的包装器,可以轻松地从表中 select 随机行。 它目前仅适用于本地 tbls。

所以在sample_n之后,调用了sample.int ,这意味着使用了标准的随机数生成器,并且您可以使用set.seed进行重现。

这个例子有帮助吗? 在其中,我使用set.seedmtcars数据集。

set.seed(1)
x <- mtcars
sample_n(x, 10)

sample_n(x, 10) #without set.seed()

set.seed(1)
x <- mtcars
sample_n(x, 10)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM