簡體   English   中英

按數字匯總分類變量:gtsummary package

[英]Summarize categorical variables by numeric: gtsummary package

我需要有關如何使用 gtsummary package 編寫 R 代碼的幫助,以創建一個匯總表,其中有幾個分類變量作為行,列側(“by”變量)在我的例子中是一個數字變量,年齡以年為單位。 所以本質上我想通過他們的平均/中位年齡來總結幾個患者的分類特征。

例如,在這個 package 中,數據“試驗”,例如,我想在表格的行軸上有分類變量(標記、階段、等級),而按變量是“年齡”,所以中位數這些變量的每個類別的年齡。

謝謝你的幫助。 耐莉

我不是 100% 清楚你在問什么。 我猜你想按高齡和低齡來總結數據(在下面的例子中分成中位數)?

首先,您需要創建一個分類年齡變量。

library(gtsummary)
library(tidyverse)

df_age_example <-
  trial %>%
  mutate(
    # create a categorical age variable split at the median
    age2 = ifelse(
      age >= median(.$age, na.rm = TRUE),
      "Age Above or at Median",
      "Age Below Median"
    )
  ) %>%
  # keep variables to be summarized 
  select(age2, marker, grade)

然后,您需要將該數據框傳遞給tbl_summary()以匯總數據。

tbl_summary(data= df_age_example, by = age2)

這將產生下表。

在此處輸入圖像描述

我希望這有幫助。 快樂編碼!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM