标签[rsample] - 堆栈内存溢出

如何通过并行化加速 tidymodels 引导 - How to speed up the tidymodels bootstrapping with parallelization

我有以下代码，它执行自举并计算置信区间。它产生但它运行非常缓慢。我怎样才能通过并行化来加速它？注意并行化的 output 需要能够被int_pctl()处理。我试过这个但失败了： ...

Python如何将月度就业数据转换为年度，csv，panda - Python how to convert monthly employment data into annual, csv, panda

我已经被这个问题卡住了两天了。下面是 csv 文件。这是我的代码。你能告诉我或给我提示或告诉我该网站有类似的问题吗？如何将月度就业数据取平均值转换为年度数据？这太混乱了。非常感谢你！非常感激我尝试在reddit论坛和Stack overflow中搜索类似的问题，他们都使用了rsam ...

Select 一个按比例分层的随机样本，其中分层基于地点和性别 - Select a proportionate stratified random sample, where stratification is based on sites and gender

我有三个 IDB，这是每个 IDB 注册的人数这是我想从每个站点 select 的样本我通过创建三个不同的层（每个站点一个）来使用以下代码，然后从每个层中选择一个随机样本但是，我正在努力指定要从每个站点中选择的性别（ male 、 female ）。 ...

gtsummary 如何为 glm 模型生成置信区间和标准误差统计数据？（包括代码示例） - How does gtsummary produce confidence intervals and standard error statistics for glm models? (Code Examples Included)

想要用对 gtsummary 的大量赞赏作为序言 -- 很棒的包。使用 tidymodels、glm 和 gtsummary 一段时间后，我一直在尝试了解 gtsummary 对 glm 模型性能和置信区间的计算。任何人和/或 Sjoberg+gtsummary 博士团队能否解释以下问题 1 ...

计算分组变量的自举重采样 - calculating bootstrap resampling for grouped variables

我有以下数据集来计算Soil_N 和 Soil_P的标准化效果大小，我为每个复制使用下面的代码。由于缺少来自 Soil_N 和 Soil_P 的一个复制的值，我想计算剩余 4 个复制的值，以便按照下面的代码为丢失的复制创建一个值。我确信这段代码需要在各自的列中分别替换 Soil_N 和 Soil ...

如何使用 initial_split r 按比例拆分数据 - How to propotionally split data using initial_split r

我想按比例拆分我拥有的数据。例如，我有 100 行，我想每两行随机抽取 1 行。使用 tidymodels rsample 我假设我会做下面的事情。检查数据时，拆分并没有达到我的预期。看起来很接近但不完全是。我认为 breaks 调用会生成从中采样的 bin。因此， breaks = 5 ...

使用 Tidymodels 进行块引导 - Block Bootstrapping using Tidymodels

我有一个关于天气和作物产量的每月（1 月 - 12 月）数据集。该数据收集了多年（2002 - 2019）。我的目标是获得每个月温度对产量差距影响的自举斜率系数。在引导程序中，我想以 function 应该在每个引导程序中随机抽取特定年份的数据而不是从混合年份中选择行的方式来阻止年份信息。 ...

rsample::bootstraps 是否存储数据而不仅仅是行索引？ - Does rsample::bootstraps store data rather than just row indices?

我试图理解为什么rsample::bootstraps function 显然存储了每个引导样本的整个数据集。我期待 function 只存储一次数据集，以及每个重新采样的引导索引。在下面您可以看到基本结构，每个重采样都会重复该结构：> set.seed(1) > test &lt ...

应用来自 rsample package 的 rolling_origin function 后取消嵌套深度列表 - Unnesting deep lists after applying the rolling_origin function from the rsample package

我有一些看起来像这样的数据：头：尾巴：这是一个具有 3 个唯一dfID和 9 个唯一group的时间序列数据。将日期列过滤为我拥有的一天（3 个 df 和 9 个组）：接下来我想将数据拆分为dfID的成对组合。所以现在我有一个包含 3 个 dfs 的列表 - 每个dfID的成对组合一个： ...