標簽[longitudinal] - 堆棧內存溢出

[英]calculating incidence of disease in R using start and end date and disease occurrence date

我有每個患者的開始和結束日期的隊列研究數據。我想計算從 2014 年 1 月 1 日到 2021 年 8 月末每年和每個月的疾病發病率。如何使用每個患者的開始和結束日期計算人月和人年，以便我可以使用以下公式得出發病率：時間范圍內的新病例數/總人口數？這是我的數據目前的樣子：陳腐的開始日期結束日 ...

在不同的時間跨度重新編碼 id

[英]Recode id in different time spans

我有不同時間跨度的同一個人的縱向數據。重置時間后如何為同一個人分配新 ID。這是一個示例數據集：預期的結果是這樣的： ...

mlr package 能否用於根據小組研究的數據進行預測？

[英]Can the mlr package be used to make predictions based on data from a panel study?

我打算做一個受監督的機器學習項目，我使用縱向研究（小組研究）的數據。目標是使用 2004 年和 2009 年的預測變量來預測 2014 年的結果。我現在已經完成了第一次數據預處理，數據框看起來像以下高度縮寫的形式：到目前為止，我的預測項目不包括時間維度（參見 data_ml: "Studyy ...

如何在 R 中的日期變量前后保留 1 年隨訪時間的行，以確保患者在整個時間內得到隨訪

[英]How to keep rows with 1 year follow up time before and after a date variable in R making sure the patient is followed up for the whole time

對於這道題，你需要復制下面的代碼來獲取df。我有 5 名患者的重復患者數據。每行代表一個咨詢日期（consdate）。每個患者的跟進時間是從 regstartdate 到 end_date。我感興趣的日期是 portal_reg_date。我只想保留滿足此條件的行：（1）保留在 porta ...

通過 R 中的 ID 將每日縱向數據折疊為每月觀察值

[英]Collapsing daily longitudinal data into monthly observations by ID in R

我有縱向數據，每個主題超過 100 行，代表日常觀察。我想按主題 ID 將列折疊到每月觀察中（即每個 ID 有多行，每 30 行（天）數據匯總一次）。如何使用 dplyr 指定這樣的天分組？另外值得注意的是，所有科目都有不同的總天數編輯：下面的數據示例 df<-structure(lis ...

如何使用 dplyr 創建基於 R 中的二進制變量的值進行計數的計數變量

[英]how to create a count variable that counts based on the value of a binary variable in R using dplyr

創建 df 的代碼：我有如下表所示的重復數據。帕蒂觀察日期登記 1 2016 年 7 月 7 日 0 1 2016 年 7 月 8 日 0 1 2016 年 7 月 11 日 1 1 2019 年 7 月 7 日 1 2 2015 年 7 月 5 日 0 2 2016 年 2 ...

根據 R 中的死亡、轉移和數據收集日期創建研究結束日期變量

[英]Create a study end date variable based on death, transfer and data collection dates in R

我在 R 中有縱向患者數據。我想從我已經擁有的三個不同日期（以先發生者為准）創建一個 end_date 變量（下表中的第 4 列），如果沒有發生死亡或轉移，end_date 將等於 data_collection_end_date：帕蒂死亡日期轉移日期 data_collection_end_d ...

當變量在 R 中具有不同的命名模式時，將寬數據重新整形為長數據

[英]Reshape wide data to long when variables have different naming pattern in R

我有一個具有以下變量名稱的廣泛數據集（簡化示例見下文）。我想將寬格式數據集轉換為長格式數據集。我已經嘗試過reshape function，但是當縱向變量的命名模式不同時，我不知道如何使用reshape function。此外，重塑 function 需要我指定每個變量集，這在我的實際分析中需 ...

如何通過 R 中的 lme4/merMod 計算“標准化”model 殘差？

[英]How does one compute the "normalized" model residuals based via lme4/merMod in R?

nlme package 為我提供了一種使用 resid(fitted object, type="normalized") 來編譯歸一化殘差的方法，但 lme4 沒有選擇這樣做。如果沒有 lme4 中的此功能，我將無法診斷自相關。我不認為 R stats package resid res ...

如何根據重復的id和時間間隔過濾重復數據

[英]how to filter repeat data based on repeated id and time interval

我在 R 中有縱向患者數據。我想根據這種情況在 patid 列中對患者進行子集：一年內（一年=任何 12 個月期間）代碼中出現三次或多次，以獲得同一張表：表格1：帕蒂觀察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2 ...

如何根據重復的id和日期過濾重復數據

[英]how to filter repeat data based on repeated id and date

我在 R 中有縱向患者數據。我想根據這種情況在 patid 列中對患者進行子集：一年內發生三次或多次表格1：帕蒂觀察日期 1 2016 年 7 月 7 日 1 2016 年 7 月 8 日 1 2016 年 7 月 11 日 1 2019 年 7 月 7 日 2 2015 年 7 月 ...

如何根據 R 中日期之間的天數過濾重復數據

[英]How to filter repeated data based on the number of days between dates in R

我在 R 中有縱向患者數據。我想根據 observation_date 對 patid 列中的患者進行子集化，其中我只保留第二次觀察日期的患者至少相隔 48 天或更長時間。請注意，observation_date 可能超過 2 個日期。表格1：帕蒂觀察日期 1 2016 年 7 月 7 日 ...

如何在每位患者的縱向數據中創建趨勢箱線圖？

[英]How to create trend boxplot in longitudinal data per patient?

我有一組帶有 ID、時間和一些變量的縱向數據：我需要做的是創建一個盒子 plot 來顯示趨勢而不是整體趨勢，每個患者的趨勢這意味着我需要為每個患者提供 1 行數據，而不是 16 行縱向數據。我也不應該匯總數據。有人對如何做到這一點有任何解決方案嗎？我對 stat 和 r 不是很熟悉 ...

如何根據 R 中的日期從重復數據中創建聚合數據

[英]how to create aggregate data from repeated data based on a date in R

我在 R 中有縱向患者數據。我想從表 1 中創建一個如下表 2 的匯總表。因此表 2 中每個患者只有一行，並且在注冊日期之前（表 1 中的第 3 列）的咨詢總數和注冊后的總咨詢次數日期表格1：帕蒂咨詢日期注冊日期咨詢次數 1 2016 年 7 月 7 日 2018 年 7 月 7 日 1 1 ...

如何將多輪調查合並為一個面板數據（R）？

[英]How to combine multiple survey rounds into one panel data (R)?

我正在分析一項縱向調查 ( https://microdata.worldbank.org/index.php/catalog/3712 )，大約有 2k 個參與家庭（每輪都在減少）。共有 11 波/輪，每輪根據問題的主題分為大約 6-8 個數據集。為了分析它，我需要它采用適當的面板數據格式， ...

如何在 SAS 中合並日期數據行？

[英]How to combine dated data rows in SAS?

我有縱向數據，但如果一個變量的值相同，我希望合並行，並更新時間變量，以便開始和結束時間反映組合的時間段。最后，僅保留組合行和唯一行。這是一個例子數據有：人開始結束重量一個 1988 ...

基於日期為R中的縱向數據創建一個虛擬變量

[英]creating a dummy variable based on dates for longitudinal data in R

我在 R 中有縱向患者數據。我想創建 new_dummy 變量，就像我在下表中演示的那樣。如果consultation_date 變量小於registration_date 變量，我希望dummy_variable 值為0，如果consultation_date 變量大於registration_ ...

R中參與者的縱向排除

[英]Longitudinal exclusion of participants in R

我有一個寬格式的大型數據集，其中有來自不同時間點（w1、w2、w3 ...）的 9 波數據和一個 ID 列。我想排除只有 1 個時間點或 0 個時間點的數據的參與者。早些時候，我使用以下代碼有條件地排除了參與者：但是，我不確定如何調整代碼以包含 w1-w9 變量，條件是其中 9 個或 8 ...

運行多行 R 代碼，每次都相差一個變量，以提高可讀性

[英]running multiple lines of R code that differ by a single variable each time to improve readability

我希望通過查看是否有一種方法可以“循環”或“重新運行”非常相似但每次只有一個變量的代碼行來提高代碼的可讀性。我的實際數據分析涉及從blme包運行多個blmer調用。我的每個分析都有一個因變量、一個自變量（其中有很多）、一個“波”變量（因為數據是在 3 個時間點收集的），以及作為隨機效應的唯一參 ...

如何獲得曲線下的面積或r中的積分

[英]how to get the area under the curve or integral in r

我有一條曲線作為下面的數據，我想計算由 x 和 y 點構成的這條曲線的曲線下面積（積分）。下面的方法正確嗎？在不知道曲線功能的情況下，如何計算特定區間內曲線下的面積？我將通過重復測量對每個人的其余數據重復此操作。此外，我需要計算一階和二階導數值的曲線下面積。我應該這樣做嗎？感謝您的意見。 ...