匯總具有連續變量和分類變量的數據集

Question

如果數據集包含混合變量：數字變量和分類變量，那么除了summary（dataset）之外，還有一種方法可以對其進行匯總，在匯總變量中，每個類別的計數包括在分類變量中，平均值包括sd，在數字變量中包括sd？

目前，我在檢查了每一列為數字或類別后編寫了一個代碼段以生成列表。 但是，更簡單的功能將很有用。

一個例子可以是data.frame（v1 = c（1：3），v2 = c（“ a”，“ b”，“ b”））），其中所需的輸出是：

V1，類型（num / cat），平均值（v1），sd（v1）V2，類型（num / cat），a，count（a），b，count（b）

Answer 1

我認為您正在尋找軟件包“ Hmisc”中的describe()函數。 有關詳細信息，請參見文檔。

Answer 2

是的，我在表中查找類別，在平均值表中查找數字變量。 對於研究論文中的描述性統計，通常會報告以下內容。

我寫了以下內容：

agg_function <- function(data_agg)
{
desc_list <- list()

    for(j in 1:ncol(data_agg))
    {
        if(is.factor(data_agg[,j]))
        {
          desc_list[[j]] <- list(Variable = colnames(data_agg) [j],table(data_agg[,j]))   ## Table of counts of labels of categorical variables
        }
        else  
        {
          desc_list[[j]] <- data.frame(Variable = colnames(data_agg)[j],Mean=mean(data_agg[,j],na.rm=T),SD = sd(data_agg[,j],na.rm=T)) ## First and second moments of numerical variables
        }
}
return(desc_list)
}

但是，有沒有更有效的解決方案？

匯總具有連續變量和分類變量的數據集

問題描述

2 個解決方案

解決方案1
1 已采納 2015-08-23 11:41:12

解決方案2
0 2015-08-24 02:00:44

匯總具有連續變量和分類變量的數據集

問題描述

2 個解決方案

解決方案1 1 已采納 2015-08-23 11:41:12

解決方案2 0 2015-08-24 02:00:44

解決方案1
1 已采納 2015-08-23 11:41:12

解決方案2
0 2015-08-24 02:00:44