我有每个患者的开始和结束日期的队列研究数据。 我想计算从 2014 年 1 月 1 日到 2021 年 8 月末每年和每个月的疾病发病率。如何使用每个患者的开始和结束日期计算人月和人年,以便我可以使用以下公式得出发病率:时间范围内的新病例数/总人口数? 这是我的数据目前的样子: 陈腐的开始日期结束日 ...
我有每个患者的开始和结束日期的队列研究数据。 我想计算从 2014 年 1 月 1 日到 2021 年 8 月末每年和每个月的疾病发病率。如何使用每个患者的开始和结束日期计算人月和人年,以便我可以使用以下公式得出发病率:时间范围内的新病例数/总人口数? 这是我的数据目前的样子: 陈腐的开始日期结束日 ...
我有不同时间跨度的同一个人的纵向数据。 重置时间后如何为同一个人分配新 ID。 这是一个示例数据集: 预期的结果是这样的: ...
我打算做一个受监督的机器学习项目,我使用纵向研究(小组研究)的数据。 目标是使用 2004 年和 2009 年的预测变量来预测 2014 年的结果。 我现在已经完成了第一次数据预处理,数据框看起来像以下高度缩写的形式: 到目前为止,我的预测项目不包括时间维度(参见 data_ml: "Studyy ...
对于这道题,你需要复制下面的代码来获取df。 我有 5 名患者的重复患者数据。 每行代表一个咨询日期(consdate)。 每个患者的跟进时间是从 regstartdate 到 end_date。 我感兴趣的日期是 portal_reg_date。 我只想保留满足此条件的行:(1)保留在 porta ...
我有纵向数据,每个主题超过 100 行,代表日常观察。 我想按主题 ID 将列折叠到每月观察中(即每个 ID 有多行,每 30 行(天)数据汇总一次)。 如何使用 dplyr 指定这样的天分组? 另外值得注意的是,所有科目都有不同的总天数编辑:下面的数据示例 df<-structure(lis ...
创建 df 的代码:我有如下表所示的重复数据。 帕蒂观察日期登记 1 2016 年 7 月 7 日 0 1 2016 年 7 月 8 日 0 1 2016 年 7 月 11 日 1 1 2019 年 7 月 7 日 1 2 2015 年 7 月 5 日 0 2 2016 年 2 ...
我在 R 中有纵向患者数据。 我想从我已经拥有的三个不同日期(以先发生者为准)创建一个 end_date 变量(下表中的第 4 列),如果没有发生死亡或转移,end_date 将等于 data_collection_end_date: 帕蒂死亡日期转移日期 data_collection_end_d ...
我有一个具有以下变量名称的广泛数据集(简化示例见下文)。 我想将宽格式数据集转换为长格式数据集。 我已经尝试过reshape function,但是当纵向变量的命名模式不同时,我不知道如何使用reshape function。 此外,重塑 function 需要我指定每个变量集,这在我的实际分析中需 ...
nlme package 为我提供了一种使用 resid(fitted object, type="normalized") 来编译归一化残差的方法,但 lme4 没有选择这样做。 如果没有 lme4 中的此功能,我将无法诊断自相关。 我不认为 R stats package resid res ...
我在 R 中有纵向患者数据。 我想根据这种情况在 patid 列中对患者进行子集:一年内(一年=任何 12 个月期间)代码中出现三次或多次,以获得同一张表: 表格1: 帕蒂观察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2 ...
我在 R 中有纵向患者数据。 我想根据这种情况在 patid 列中对患者进行子集:一年内发生三次或多次表格1: 帕蒂观察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2019 年 7 月 7 日 2 2015 年 7 月 ...
我在 R 中有纵向患者数据。 我想根据 observation_date 对 patid 列中的患者进行子集化,其中我只保留第二次观察日期的患者至少相隔 48 天或更长时间。 请注意,observation_date 可能超过 2 个日期。 表格1: 帕蒂观察日期 1 2016 年 7 月 7 日 ...
我有一组带有 ID、时间和一些变量的纵向数据: 我需要做的是创建一个盒子 plot 来显示趋势而不是整体趋势,每个患者的趋势这意味着我需要为每个患者提供 1 行数据,而不是 16 行纵向数据。 我也不应该汇总数据。 有人对如何做到这一点有任何解决方案吗? 我对 stat 和 r 不是很熟悉 ...
我在 R 中有纵向患者数据。 我想从表 1 中创建一个如下表 2 的汇总表。因此表 2 中每个患者只有一行,并且在注册日期之前(表 1 中的第 3 列)的咨询总数和注册后的总咨询次数日期表格1: 帕蒂咨询日期注册日期咨询次数 1 2016 年 7 月 7 日 2018 年 7 月 7 日 1 1 ...
我正在分析一项纵向调查 ( https://microdata.worldbank.org/index.php/catalog/3712 ),大约有 2k 个参与家庭(每轮都在减少)。 共有 11 波/轮,每轮根据问题的主题分为大约 6-8 个数据集。 为了分析它,我需要它采用适当的面板数据格式, ...
我有纵向数据,但如果一个变量的值相同,我希望合并行,并更新时间变量,以便开始和结束时间反映组合的时间段。 最后,仅保留组合行和唯一行。 这是一个例子 数据有: 人 开始 结束 重量 一个 1988 ...
我在 R 中有纵向患者数据。我想创建 new_dummy 变量,就像我在下表中演示的那样。 如果consultation_date 变量小于registration_date 变量,我希望dummy_variable 值为0,如果consultation_date 变量大于registration_ ...
我有一个宽格式的大型数据集,其中有来自不同时间点(w1、w2、w3 ...)的 9 波数据和一个 ID 列。 我想排除只有 1 个时间点或 0 个时间点的数据的参与者。 早些时候,我使用以下代码有条件地排除了参与者: 但是,我不确定如何调整代码以包含 w1-w9 变量,条件是其中 9 个或 8 ...
我希望通过查看是否有一种方法可以“循环”或“重新运行”非常相似但每次只有一个变量的代码行来提高代码的可读性。 我的实际数据分析涉及从blme包运行多个blmer调用。 我的每个分析都有一个因变量、一个自变量(其中有很多)、一个“波”变量(因为数据是在 3 个时间点收集的),以及作为随机效应的唯一参 ...
我有一条曲线作为下面的数据,我想计算由 x 和 y 点构成的这条曲线的曲线下面积(积分)。 下面的方法正确吗? 在不知道曲线功能的情况下,如何计算特定区间内曲线下的面积? 我将通过重复测量对每个人的其余数据重复此操作。 此外,我需要计算一阶和二阶导数值的曲线下面积。 我应该这样做吗? 感谢您的意见。 ...