簡體   English   中英

R中的三向制表

[英]3-way tabulation in R

我有一個看起來像的數據集

| ID | Category | Failure |
|----+----------+---------|
|  1 | a        | 0       |
|  1 | b        | 0       |
|  1 | b        | 0       |
|  1 | a        | 0       |
|  1 | c        | 0       |
|  1 | d        | 0       |
|  1 | c        | 0       |
|  1 | failure  | 1       |
|  2 | c        | 0       |
|  2 | d        | 0       |
|  2 | d        | 0       |
|  2 | b        | 0       |

這是數據,其中每個ID通過事件{a, b, c, d}的中間序列可能以失敗事件結束。 我希望能夠計算每個中間事件因故障事件而發生的ID數。

所以,我想要一張表格

|            | a | b | c | d |
|------------+---+---+---+---|
| Failure    | 4 | 5 | 6 | 2 |
| No failure | 9 | 8 | 6 | 9 |

其中,例如,數字4表示發生故障的ID中a 4個在ID中以失敗結束。

我將如何在R中執行此操作?

您可以使用table為例:

dat <- data.frame(categ=sample(letters[1:4],20,rep=T),
                  failure=sample(c(0,1),20,rep=T))

res <- table(dat$failure,dat$categ)
rownames(res) <- c('Failure','No failure')
res
           a b c d
Failure    3 2 2 1
No failure 1 2 4 5

您可以使用barplotbarplot

barplot(res)

在此處輸入圖片說明

編輯通過ID得到這個,你可以使用by例如:

  dat <- data.frame(ID=c(rep(1,9),rep(2,11)),categ=sample(letters[1:4],20,rep=T),
               failure=sample(c(0,1),20,rep=T))
 by(dat,dat$ID,function(x)table(x$failure,x$categ))
dat$ID: 1

    a b c d
  0 1 2 1 3
  1 1 1 0 0
--------------------------------------------------------------------------------------- 
dat$ID: 2

    a b c d
  0 1 2 3 0
  1 1 3 1 0

使用Tapply 編輯

另一種方法是使用tapply

  with(dat,tapply(categ,list(failure,categ,ID),length))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM