簡體   English   中英

關系類別變量的圖形表示

[英]Graphical Representation of Relational Categorical Variables

我正在尋找一些想法,以更好地說明分類變量之間的關系。

對於可復制的數據,我有以下內容:

t1 <- data.frame(A = c("Apple", "Rose, Apple", "Country"), 
                 B = c("Fruit", "Plant", "Peru, Japan"))

輸出量

            A           B
1       Apple       Fruit
2 Rose, Apple       Plant
3     Country Peru, Japan

您會看到蘋果與水果和植物有關。 是否有很好的圖形解決方案以熱圖格式彩色顯示各個變量?

我會想到這樣的事情:

library(data.table)

dt <- data.table(type = as.factor(c("Apple", "Rose", "Apple", "Rose", "Apple")),
                 type2 = as.factor(c("Fruit", "Plant", "Plant", "Tree", "Tree")))

首先,我們得到了具有不同組合的表格:

dt 
    type type2
1: Apple Fruit
2:  Rose Plant
3: Apple Plant
4:  Rose  Tree
5: Apple  Tree

然后我們得到一些統計數據(計數和相對百分比):

dt2 <- dt[ , .(count = .N), by = .(type, type2)]

dt2[ , percentage.count := count / sum(count) * 100 , by = "type"]

dt2

    type type2 count percentage.count
1: Apple Fruit     1         33.33333
2:  Rose Plant     1         50.00000
3: Apple Plant     1         33.33333
4:  Rose  Tree     1         50.00000
5: Apple  Tree     1         33.33333

在這里我們可以看到, apple是有關1/3隨着時代Fruit1/3的時間用Plant1/3的與時俱進Tree

可以這樣繪制:

ggplot(data = dt2,
       aes(x = type, fill = type2)) +
  geom_bar(position = "fill")

在此處輸入圖片說明

這就像有一個“餅”,即我們擁有多少個具有相同typetype2組合,但至少可以看出哪些類型比其他類型更相關。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM