cost 280 ms
使用开始和结束日期以及疾病发生日期计算 R 中的疾病发生率 - calculating incidence of disease in R using start and end date and disease occurrence date

我有每个患者的开始和结束日期的队列研究数据。 我想计算从 2014 年 1 月 1 日到 2021 年 8 月末每年和每个月的疾病发病率。如何使用每个患者的开始和结束日期计算人月和人年,以便我可以使用以下公式得出发病率:时间范围内的新病例数/总人口数? 这是我的数据目前的样子: 陈腐的开始日期结束日 ...

mlr package 能否用于根据小组研究的数据进行预测? - Can the mlr package be used to make predictions based on data from a panel study?

我打算做一个受监督的机器学习项目,我使用纵向研究(小组研究)的数据。 目标是使用 2004 年和 2009 年的预测变量来预测 2014 年的结果。 我现在已经完成了第一次数据预处理,数据框看起来像以下高度缩写的形式: 到目前为止,我的预测项目不包括时间维度(参见 data_ml: "Studyy ...

如何在 R 中的日期变量前后保留 1 年随访时间的行,以确保患者在整个时间内得到随访 - How to keep rows with 1 year follow up time before and after a date variable in R making sure the patient is followed up for the whole time

对于这道题,你需要复制下面的代码来获取df。 我有 5 名患者的重复患者数据。 每行代表一个咨询日期(consdate)。 每个患者的跟进时间是从 regstartdate 到 end_date。 我感兴趣的日期是 portal_reg_date。 我只想保留满足此条件的行:(1)保留在 porta ...

通过 R 中的 ID 将每日纵向数据折叠为每月观察值 - Collapsing daily longitudinal data into monthly observations by ID in R

我有纵向数据,每个主题超过 100 行,代表日常观察。 我想按主题 ID 将列折叠到每月观察中(即每个 ID 有多行,每 30 行(天)数据汇总一次)。 如何使用 dplyr 指定这样的天分组? 另外值得注意的是,所有科目都有不同的总天数编辑:下面的数据示例 df<-structure(lis ...

如何使用 dplyr 创建基于 R 中的二进制变量的值进行计数的计数变量 - how to create a count variable that counts based on the value of a binary variable in R using dplyr

创建 df 的代码:我有如下表所示的重复数据。 帕蒂观察日期登记 1 2016 年 7 月 7 日 0 1 2016 年 7 月 8 日 0 1 2016 年 7 月 11 日 1 1 2019 年 7 月 7 日 1 2 2015 年 7 月 5 日 0 2 2016 年 2 ...

根据 R 中的死亡、转移和数据收集日期创建研究结束日期变量 - Create a study end date variable based on death, transfer and data collection dates in R

我在 R 中有纵向患者数据。 我想从我已经拥有的三个不同日期(以先发生者为准)创建一个 end_date 变量(下表中的第 4 列),如果没有发生死亡或转移,end_date 将等于 data_collection_end_date: 帕蒂死亡日期转移日期 data_collection_end_d ...

当变量在 R 中具有不同的命名模式时,将宽数据重新整形为长数据 - Reshape wide data to long when variables have different naming pattern in R

我有一个具有以下变量名称的广泛数据集(简化示例见下文)。 我想将宽格式数据集转换为长格式数据集。 我已经尝试过reshape function,但是当纵向变量的命名模式不同时,我不知道如何使用reshape function。 此外,重塑 function 需要我指定每个变量集,这在我的实际分析中需 ...

如何通过 R 中的 lme4/merMod 计算“标准化”model 残差? - How does one compute the "normalized" model residuals based via lme4/merMod in R?

nlme package 为我提供了一种使用 resid(fitted object, type="normalized") 来编译归一化残差的方法,但 lme4 没有选择这样做。 如果没有 lme4 中的此功能,我将无法诊断自相关。 我不认为 R stats package resid res ...

如何根据重复的id和时间间隔过滤重复数据 - how to filter repeat data based on repeated id and time interval

我在 R 中有纵向患者数据。 我想根据这种情况在 patid 列中对患者进行子集:一年内(一年=任何 12 个月期间)代码中出现三次或多次,以获得同一张表: 表格1: 帕蒂观察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2 ...

如何根据 R 中日期之间的天数过滤重复数据 - How to filter repeated data based on the number of days between dates in R

我在 R 中有纵向患者数据。 我想根据 observation_date 对 patid 列中的患者进行子集化,其中我只保留第二次观察日期的患者至少相隔 48 天或更长时间。 请注意,observation_date 可能超过 2 个日期。 表格1: 帕蒂观察日期 1 2016 年 7 月 7 日 ...

如何在每位患者的纵向数据中创建趋势箱线图? - How to create trend boxplot in longitudinal data per patient?

我有一组带有 ID、时间和一些变量的纵向数据: 我需要做的是创建一个盒子 plot 来显示趋势而不是整体趋势,每个患者的趋势这意味着我需要为每个患者提供 1 行数据,而不是 16 行纵向数据。 我也不应该汇总数据。 有人对如何做到这一点有任何解决方案吗? 我对 stat 和 r 不是很熟悉 ...

如何根据 R 中的日期从重复数据中创建聚合数据 - how to create aggregate data from repeated data based on a date in R

我在 R 中有纵向患者数据。 我想从表 1 中创建一个如下表 2 的汇总表。因此表 2 中每个患者只有一行,并且在注册日期之前(表 1 中的第 3 列)的咨询总数和注册后的总咨询次数日期表格1: 帕蒂咨询日期注册日期咨询次数 1 2016 年 7 月 7 日 2018 年 7 月 7 日 1 1 ...

如何将多轮调查合并为一个面板数据(R)? - How to combine multiple survey rounds into one panel data (R)?

我正在分析一项纵向调查 ( https://microdata.worldbank.org/index.php/catalog/3712 ),大约有 2k 个参与家庭(每轮都在减少)。 共有 11 波/轮,每轮根据问题的主题分为大约 6-8 个数据集。 为了分析它,我需要它采用适当的面板数据格式, ...

R中参与者的纵向排除 - Longitudinal exclusion of participants in R

我有一个宽格式的大型数据集,其中有来自不同时间点(w1、w2、w3 ...)的 9 波数据和一个 ID 列。 我想排除只有 1 个时间点或 0 个时间点的数据的参与者。 早些时候,我使用以下代码有条件地排除了参与者: 但是,我不确定如何调整代码以包含 w1-w9 变量,条件是其中 9 个或 8 ...

运行多行 R 代码,每次都相差一个变量,以提高可读性 - running multiple lines of R code that differ by a single variable each time to improve readability

我希望通过查看是否有一种方法可以“循环”或“重新运行”非常相似但每次只有一个变量的代码行来提高代码的可读性。 我的实际数据分析涉及从blme包运行多个blmer调用。 我的每个分析都有一个因变量、一个自变量(其中有很多)、一个“波”变量(因为数据是在 3 个时间点收集的),以及作为随机效应的唯一参 ...

如何获得曲线下的面积或r中的积分 - how to get the area under the curve or integral in r

我有一条曲线作为下面的数据,我想计算由 x 和 y 点构成的这条曲线的曲线下面积(积分)。 下面的方法正确吗? 在不知道曲线功能的情况下,如何计算特定区间内曲线下的面积? 我将通过重复测量对每个人的其余数据重复此操作。 此外,我需要计算一阶和二阶导数值的曲线下面积。 我应该这样做吗? 感谢您的意见。 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM