我有以下代码,它执行自举并计算置信区间。 它产生 但它运行非常缓慢。 我怎样才能通过并行化来加速它? 注意并行化的 output 需要能够被int_pctl()处理。 我试过这个但失败了: ...
我有以下代码,它执行自举并计算置信区间。 它产生 但它运行非常缓慢。 我怎样才能通过并行化来加速它? 注意并行化的 output 需要能够被int_pctl()处理。 我试过这个但失败了: ...
我已经被这个问题卡住了两天了。 下面是 csv 文件。 这是我的代码。 你能告诉我或给我提示或告诉我该网站有类似的问题吗? 如何将月度就业数据取平均值转换为年度数据? 这太混乱了。 非常感谢你! 非常感激我尝试在reddit论坛和Stack overflow中搜索类似的问题,他们都使用了rsam ...
我有三个 IDB,这是每个 IDB 注册的人数 这是我想从每个站点 select 的样本 我通过创建三个不同的层(每个站点一个)来使用以下代码,然后从每个层中选择一个随机样本 但是,我正在努力指定要从每个站点中选择的性别( male 、 female )。 ...
想要用对 gtsummary 的大量赞赏作为序言 -- 很棒的包。 使用 tidymodels、glm 和 gtsummary 一段时间后,我一直在尝试了解 gtsummary 对 glm 模型性能和置信区间的计算。 任何人和/或 Sjoberg+gtsummary 博士团队能否解释以下问题 1 ...
我有以下数据集来计算Soil_N 和 Soil_P的标准化效果大小,我为每个复制使用下面的代码。 由于缺少来自 Soil_N 和 Soil_P 的一个复制的值,我想计算剩余 4 个复制的值,以便按照下面的代码为丢失的复制创建一个值。 我确信这段代码需要在各自的列中分别替换 Soil_N 和 Soil ...
我想按比例拆分我拥有的数据。 例如,我有 100 行,我想每两行随机抽取 1 行。 使用 tidymodels rsample 我假设我会做下面的事情。 检查数据时,拆分并没有达到我的预期。 看起来很接近但不完全是。 我认为 breaks 调用会生成从中采样的 bin。 因此, breaks = 5 ...
我有一个关于天气和作物产量的每月(1 月 - 12 月)数据集。 该数据收集了多年(2002 - 2019) 。 我的目标是获得每个月温度对产量差距影响的自举斜率系数。 在引导程序中,我想以 function 应该在每个引导程序中随机抽取特定年份的数据而不是从混合年份中选择行的方式来阻止年份信息。 ...
我试图理解为什么rsample::bootstraps function 显然存储了每个引导样本的整个数据集。 我期待 function 只存储一次数据集,以及每个重新采样的引导索引。 在下面您可以看到基本结构,每个重采样都会重复该结构:> set.seed(1) > test < ...
我有一些看起来像这样的数据: 头: 尾巴: 这是一个具有 3 个唯一dfID和 9 个唯一group的时间序列数据。 将日期列过滤为我拥有的一天(3 个 df 和 9 个组): 接下来我想将数据拆分为dfID的成对组合。 所以现在我有一个包含 3 个 dfs 的列表 - 每个dfID的成对组合一个: ...