[英]Summarize categorical variables by numeric: gtsummary package
我需要有關如何使用 gtsummary package 編寫 R 代碼的幫助,以創建一個匯總表,其中有幾個分類變量作為行,列側(“by”變量)在我的例子中是一個數字變量,年齡以年為單位。 所以本質上我想通過他們的平均/中位年齡來總結幾個患者的分類特征。
例如,在這個 package 中,數據“試驗”,例如,我想在表格的行軸上有分類變量(標記、階段、等級),而按變量是“年齡”,所以中位數這些變量的每個類別的年齡。
謝謝你的幫助。 耐莉
我不是 100% 清楚你在問什么。 我猜你想按高齡和低齡來總結數據(在下面的例子中分成中位數)?
首先,您需要創建一個分類年齡變量。
library(gtsummary)
library(tidyverse)
df_age_example <-
trial %>%
mutate(
# create a categorical age variable split at the median
age2 = ifelse(
age >= median(.$age, na.rm = TRUE),
"Age Above or at Median",
"Age Below Median"
)
) %>%
# keep variables to be summarized
select(age2, marker, grade)
然后,您需要將該數據框傳遞給tbl_summary()
以匯總數據。
tbl_summary(data= df_age_example, by = age2)
這將產生下表。
我希望這有幫助。 快樂編碼!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.