cost 303 ms
使用開始和結束日期以及疾病發生日期計算 R 中的疾病發生率

[英]calculating incidence of disease in R using start and end date and disease occurrence date

我有每個患者的開始和結束日期的隊列研究數據。 我想計算從 2014 年 1 月 1 日到 2021 年 8 月末每年和每個月的疾病發病率。如何使用每個患者的開始和結束日期計算人月和人年,以便我可以使用以下公式得出發病率:時間范圍內的新病例數/總人口數? 這是我的數據目前的樣子: 陳腐的開始日期結束日 ...

mlr package 能否用於根據小組研究的數據進行預測?

[英]Can the mlr package be used to make predictions based on data from a panel study?

我打算做一個受監督的機器學習項目,我使用縱向研究(小組研究)的數據。 目標是使用 2004 年和 2009 年的預測變量來預測 2014 年的結果。 我現在已經完成了第一次數據預處理,數據框看起來像以下高度縮寫的形式: 到目前為止,我的預測項目不包括時間維度(參見 data_ml: "Studyy ...

如何在 R 中的日期變量前后保留 1 年隨訪時間的行,以確保患者在整個時間內得到隨訪

[英]How to keep rows with 1 year follow up time before and after a date variable in R making sure the patient is followed up for the whole time

對於這道題,你需要復制下面的代碼來獲取df。 我有 5 名患者的重復患者數據。 每行代表一個咨詢日期(consdate)。 每個患者的跟進時間是從 regstartdate 到 end_date。 我感興趣的日期是 portal_reg_date。 我只想保留滿足此條件的行:(1)保留在 porta ...

通過 R 中的 ID 將每日縱向數據折疊為每月觀察值

[英]Collapsing daily longitudinal data into monthly observations by ID in R

我有縱向數據,每個主題超過 100 行,代表日常觀察。 我想按主題 ID 將列折疊到每月觀察中(即每個 ID 有多行,每 30 行(天)數據匯總一次)。 如何使用 dplyr 指定這樣的天分組? 另外值得注意的是,所有科目都有不同的總天數編輯:下面的數據示例 df<-structure(lis ...

如何使用 dplyr 創建基於 R 中的二進制變量的值進行計數的計數變量

[英]how to create a count variable that counts based on the value of a binary variable in R using dplyr

創建 df 的代碼:我有如下表所示的重復數據。 帕蒂觀察日期登記 1 2016 年 7 月 7 日 0 1 2016 年 7 月 8 日 0 1 2016 年 7 月 11 日 1 1 2019 年 7 月 7 日 1 2 2015 年 7 月 5 日 0 2 2016 年 2 ...

根據 R 中的死亡、轉移和數據收集日期創建研究結束日期變量

[英]Create a study end date variable based on death, transfer and data collection dates in R

我在 R 中有縱向患者數據。 我想從我已經擁有的三個不同日期(以先發生者為准)創建一個 end_date 變量(下表中的第 4 列),如果沒有發生死亡或轉移,end_date 將等於 data_collection_end_date: 帕蒂死亡日期轉移日期 data_collection_end_d ...

當變量在 R 中具有不同的命名模式時,將寬數據重新整形為長數據

[英]Reshape wide data to long when variables have different naming pattern in R

我有一個具有以下變量名稱的廣泛數據集(簡化示例見下文)。 我想將寬格式數據集轉換為長格式數據集。 我已經嘗試過reshape function,但是當縱向變量的命名模式不同時,我不知道如何使用reshape function。 此外,重塑 function 需要我指定每個變量集,這在我的實際分析中需 ...

如何通過 R 中的 lme4/merMod 計算“標准化”model 殘差?

[英]How does one compute the "normalized" model residuals based via lme4/merMod in R?

nlme package 為我提供了一種使用 resid(fitted object, type="normalized") 來編譯歸一化殘差的方法,但 lme4 沒有選擇這樣做。 如果沒有 lme4 中的此功能,我將無法診斷自相關。 我不認為 R stats package resid res ...

如何根據重復的id和時間間隔過濾重復數據

[英]how to filter repeat data based on repeated id and time interval

我在 R 中有縱向患者數據。 我想根據這種情況在 patid 列中對患者進行子集:一年內(一年=任何 12 個月期間)代碼中出現三次或多次,以獲得同一張表: 表格1: 帕蒂觀察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2 ...

如何根據重復的id和日期過濾重復數據

[英]how to filter repeat data based on repeated id and date

我在 R 中有縱向患者數據。 我想根據這種情況在 patid 列中對患者進行子集:一年內發生三次或多次表格1: 帕蒂觀察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2019 年 7 月 7 日 2 2015 年 7 月 ...

如何根據 R 中日期之間的天數過濾重復數據

[英]How to filter repeated data based on the number of days between dates in R

我在 R 中有縱向患者數據。 我想根據 observation_date 對 patid 列中的患者進行子集化,其中我只保留第二次觀察日期的患者至少相隔 48 天或更長時間。 請注意,observation_date 可能超過 2 個日期。 表格1: 帕蒂觀察日期 1 2016 年 7 月 7 日 ...

如何在每位患者的縱向數據中創建趨勢箱線圖?

[英]How to create trend boxplot in longitudinal data per patient?

我有一組帶有 ID、時間和一些變量的縱向數據: 我需要做的是創建一個盒子 plot 來顯示趨勢而不是整體趨勢,每個患者的趨勢這意味着我需要為每個患者提供 1 行數據,而不是 16 行縱向數據。 我也不應該匯總數據。 有人對如何做到這一點有任何解決方案嗎? 我對 stat 和 r 不是很熟悉 ...

如何根據 R 中的日期從重復數據中創建聚合數據

[英]how to create aggregate data from repeated data based on a date in R

我在 R 中有縱向患者數據。 我想從表 1 中創建一個如下表 2 的匯總表。因此表 2 中每個患者只有一行,並且在注冊日期之前(表 1 中的第 3 列)的咨詢總數和注冊后的總咨詢次數日期表格1: 帕蒂咨詢日期注冊日期咨詢次數 1 2016 年 7 月 7 日 2018 年 7 月 7 日 1 1 ...

如何將多輪調查合並為一個面板數據(R)?

[英]How to combine multiple survey rounds into one panel data (R)?

我正在分析一項縱向調查 ( https://microdata.worldbank.org/index.php/catalog/3712 ),大約有 2k 個參與家庭(每輪都在減少)。 共有 11 波/輪,每輪根據問題的主題分為大約 6-8 個數據集。 為了分析它,我需要它采用適當的面板數據格式, ...

如何在 SAS 中合並日期數據行?

[英]How to combine dated data rows in SAS?

我有縱向數據,但如果一個變量的值相同,我希望合並行,並更新時間變量,以便開始和結束時間反映組合的時間段。 最后,僅保留組合行和唯一行。 這是一個例子 數據有: 人 開始 結束 重量 一個 1988 ...

基於日期為R中的縱向數據創建一個虛擬變量

[英]creating a dummy variable based on dates for longitudinal data in R

我在 R 中有縱向患者數據。我想創建 new_dummy 變量,就像我在下表中演示的那樣。 如果consultation_date 變量小於registration_date 變量,我希望dummy_variable 值為0,如果consultation_date 變量大於registration_ ...

R中參與者的縱向排除

[英]Longitudinal exclusion of participants in R

我有一個寬格式的大型數據集,其中有來自不同時間點(w1、w2、w3 ...)的 9 波數據和一個 ID 列。 我想排除只有 1 個時間點或 0 個時間點的數據的參與者。 早些時候,我使用以下代碼有條件地排除了參與者: 但是,我不確定如何調整代碼以包含 w1-w9 變量,條件是其中 9 個或 8 ...

運行多行 R 代碼,每次都相差一個變量,以提高可讀性

[英]running multiple lines of R code that differ by a single variable each time to improve readability

我希望通過查看是否有一種方法可以“循環”或“重新運行”非常相似但每次只有一個變量的代碼行來提高代碼的可讀性。 我的實際數據分析涉及從blme包運行多個blmer調用。 我的每個分析都有一個因變量、一個自變量(其中有很多)、一個“波”變量(因為數據是在 3 個時間點收集的),以及作為隨機效應的唯一參 ...

如何獲得曲線下的面積或r中的積分

[英]how to get the area under the curve or integral in r

我有一條曲線作為下面的數據,我想計算由 x 和 y 點構成的這條曲線的曲線下面積(積分)。 下面的方法正確嗎? 在不知道曲線功能的情況下,如何計算特定區間內曲線下的面積? 我將通過重復測量對每個人的其余數據重復此操作。 此外,我需要計算一階和二階導數值的曲線下面積。 我應該這樣做嗎? 感謝您的意見。 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM