标签[longitudinal] - 堆栈内存溢出

使用开始和结束日期以及疾病发生日期计算 R 中的疾病发生率 - calculating incidence of disease in R using start and end date and disease occurrence date

我有每个患者的开始和结束日期的队列研究数据。我想计算从 2014 年 1 月 1 日到 2021 年 8 月末每年和每个月的疾病发病率。如何使用每个患者的开始和结束日期计算人月和人年，以便我可以使用以下公式得出发病率：时间范围内的新病例数/总人口数？这是我的数据目前的样子：陈腐的开始日期结束日 ...

在不同的时间跨度重新编码 id - Recode id in different time spans

我有不同时间跨度的同一个人的纵向数据。重置时间后如何为同一个人分配新 ID。这是一个示例数据集：预期的结果是这样的： ...

mlr package 能否用于根据小组研究的数据进行预测？ - Can the mlr package be used to make predictions based on data from a panel study?

我打算做一个受监督的机器学习项目，我使用纵向研究（小组研究）的数据。目标是使用 2004 年和 2009 年的预测变量来预测 2014 年的结果。我现在已经完成了第一次数据预处理，数据框看起来像以下高度缩写的形式：到目前为止，我的预测项目不包括时间维度（参见 data_ml: "Studyy ...

如何在 R 中的日期变量前后保留 1 年随访时间的行，以确保患者在整个时间内得到随访 - How to keep rows with 1 year follow up time before and after a date variable in R making sure the patient is followed up for the whole time

对于这道题，你需要复制下面的代码来获取df。我有 5 名患者的重复患者数据。每行代表一个咨询日期（consdate）。每个患者的跟进时间是从 regstartdate 到 end_date。我感兴趣的日期是 portal_reg_date。我只想保留满足此条件的行：（1）保留在 porta ...

通过 R 中的 ID 将每日纵向数据折叠为每月观察值 - Collapsing daily longitudinal data into monthly observations by ID in R

我有纵向数据，每个主题超过 100 行，代表日常观察。我想按主题 ID 将列折叠到每月观察中（即每个 ID 有多行，每 30 行（天）数据汇总一次）。如何使用 dplyr 指定这样的天分组？另外值得注意的是，所有科目都有不同的总天数编辑：下面的数据示例 df<-structure(lis ...

如何使用 dplyr 创建基于 R 中的二进制变量的值进行计数的计数变量 - how to create a count variable that counts based on the value of a binary variable in R using dplyr

创建 df 的代码：我有如下表所示的重复数据。帕蒂观察日期登记 1 2016 年 7 月 7 日 0 1 2016 年 7 月 8 日 0 1 2016 年 7 月 11 日 1 1 2019 年 7 月 7 日 1 2 2015 年 7 月 5 日 0 2 2016 年 2 ...

根据 R 中的死亡、转移和数据收集日期创建研究结束日期变量 - Create a study end date variable based on death, transfer and data collection dates in R

我在 R 中有纵向患者数据。我想从我已经拥有的三个不同日期（以先发生者为准）创建一个 end_date 变量（下表中的第 4 列），如果没有发生死亡或转移，end_date 将等于 data_collection_end_date：帕蒂死亡日期转移日期 data_collection_end_d ...

当变量在 R 中具有不同的命名模式时，将宽数据重新整形为长数据 - Reshape wide data to long when variables have different naming pattern in R

我有一个具有以下变量名称的广泛数据集（简化示例见下文）。我想将宽格式数据集转换为长格式数据集。我已经尝试过reshape function，但是当纵向变量的命名模式不同时，我不知道如何使用reshape function。此外，重塑 function 需要我指定每个变量集，这在我的实际分析中需 ...

如何通过 R 中的 lme4/merMod 计算“标准化”model 残差？ - How does one compute the "normalized" model residuals based via lme4/merMod in R?

nlme package 为我提供了一种使用 resid(fitted object, type="normalized") 来编译归一化残差的方法，但 lme4 没有选择这样做。如果没有 lme4 中的此功能，我将无法诊断自相关。我不认为 R stats package resid res ...

如何根据重复的id和时间间隔过滤重复数据 - how to filter repeat data based on repeated id and time interval

我在 R 中有纵向患者数据。我想根据这种情况在 patid 列中对患者进行子集：一年内（一年=任何 12 个月期间）代码中出现三次或多次，以获得同一张表：表格1：帕蒂观察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2 ...

如何根据重复的id和日期过滤重复数据 - how to filter repeat data based on repeated id and date

我在 R 中有纵向患者数据。我想根据这种情况在 patid 列中对患者进行子集：一年内发生三次或多次表格1：帕蒂观察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2019 年 7 月 7 日 2 2015 年 7 月 ...

如何根据 R 中日期之间的天数过滤重复数据 - How to filter repeated data based on the number of days between dates in R

我在 R 中有纵向患者数据。我想根据 observation_date 对 patid 列中的患者进行子集化，其中我只保留第二次观察日期的患者至少相隔 48 天或更长时间。请注意，observation_date 可能超过 2 个日期。表格1：帕蒂观察日期 1 2016 年 7 月 7 日 ...

如何在每位患者的纵向数据中创建趋势箱线图？ - How to create trend boxplot in longitudinal data per patient?

我有一组带有 ID、时间和一些变量的纵向数据：我需要做的是创建一个盒子 plot 来显示趋势而不是整体趋势，每个患者的趋势这意味着我需要为每个患者提供 1 行数据，而不是 16 行纵向数据。我也不应该汇总数据。有人对如何做到这一点有任何解决方案吗？我对 stat 和 r 不是很熟悉 ...

如何根据 R 中的日期从重复数据中创建聚合数据 - how to create aggregate data from repeated data based on a date in R

我在 R 中有纵向患者数据。我想从表 1 中创建一个如下表 2 的汇总表。因此表 2 中每个患者只有一行，并且在注册日期之前（表 1 中的第 3 列）的咨询总数和注册后的总咨询次数日期表格1：帕蒂咨询日期注册日期咨询次数 1 2016 年 7 月 7 日 2018 年 7 月 7 日 1 1 ...

如何将多轮调查合并为一个面板数据（R）？ - How to combine multiple survey rounds into one panel data (R)?

我正在分析一项纵向调查 ( https://microdata.worldbank.org/index.php/catalog/3712 )，大约有 2k 个参与家庭（每轮都在减少）。共有 11 波/轮，每轮根据问题的主题分为大约 6-8 个数据集。为了分析它，我需要它采用适当的面板数据格式， ...

如何在 SAS 中合并日期数据行？ - How to combine dated data rows in SAS?

我有纵向数据，但如果一个变量的值相同，我希望合并行，并更新时间变量，以便开始和结束时间反映组合的时间段。最后，仅保留组合行和唯一行。这是一个例子数据有：人开始结束重量一个 1988 ...

基于日期为R中的纵向数据创建一个虚拟变量 - creating a dummy variable based on dates for longitudinal data in R

我在 R 中有纵向患者数据。我想创建 new_dummy 变量，就像我在下表中演示的那样。如果consultation_date 变量小于registration_date 变量，我希望dummy_variable 值为0，如果consultation_date 变量大于registration_ ...

R中参与者的纵向排除 - Longitudinal exclusion of participants in R

我有一个宽格式的大型数据集，其中有来自不同时间点（w1、w2、w3 ...）的 9 波数据和一个 ID 列。我想排除只有 1 个时间点或 0 个时间点的数据的参与者。早些时候，我使用以下代码有条件地排除了参与者：但是，我不确定如何调整代码以包含 w1-w9 变量，条件是其中 9 个或 8 ...

运行多行 R 代码，每次都相差一个变量，以提高可读性 - running multiple lines of R code that differ by a single variable each time to improve readability

我希望通过查看是否有一种方法可以“循环”或“重新运行”非常相似但每次只有一个变量的代码行来提高代码的可读性。我的实际数据分析涉及从blme包运行多个blmer调用。我的每个分析都有一个因变量、一个自变量（其中有很多）、一个“波”变量（因为数据是在 3 个时间点收集的），以及作为随机效应的唯一参 ...

如何获得曲线下的面积或r中的积分 - how to get the area under the curve or integral in r

我有一条曲线作为下面的数据，我想计算由 x 和 y 点构成的这条曲线的曲线下面积（积分）。下面的方法正确吗？在不知道曲线功能的情况下，如何计算特定区间内曲线下的面积？我将通过重复测量对每个人的其余数据重复此操作。此外，我需要计算一阶和二阶导数值的曲线下面积。我应该这样做吗？感谢您的意见。 ...