[英]Summarize and Transpose rows to columns in R
這是我的輸入數據:
Program = c("A","A","A","B","B","C")
Age = c(10,30,30,12,32,53)
Gender = c("F","F","M","M","M","F")
Language = c("Eng","Eng","Kor","Kor","Other","Other")
df = data.frame(Program,Age,Gender,Language)
我想 output 像這樣的表:
程序 | 平均年齡 | 英文 | 韓國 | 女性 | 男性 |
---|---|---|---|---|---|
一個 | |||||
乙 | |||||
C |
MEAN AGE 是平均年齡,ENG,KOR,FEMALE,MALE 是計數。
我曾嘗試使用 dplyr 和 t() 但在這種情況下,我覺得我完全不知道步驟是什么(我的第一篇文章,新的)。 先感謝您!
您可以采取以下方法:
library(dplyr)
df %>%
group_by(Program) %>%
summarise(
`Mean Age` = mean(Age),
ENG = sum(Language=="Eng"),
KOR = sum(Language=="Kor"),
Female = sum(Gender=="F"),
Male = sum(Gender=="M"),
.groups="drop"
)
Output:
# A tibble: 3 x 6
Program `Mean Age` ENG KOR Female Male
<chr> <dbl> <int> <int> <int> <int>
1 A 23.3 2 1 2 1
2 B 22 0 1 0 2
3 C 53 0 0 1 0
注意: .groups
是dplyr
函數的特殊變量。 這里使用的方式相當於在計算后使用%>% ungroup()
。 如果您在summarise
function 中鍵入任何其他名稱,它將假定它是列名稱。
在基礎 R 中,您可以執行以下操作:
df1 <- cbind(df[1:2], stack(df[3:4])[-2])
cbind(aggregate(Age~Program, df, mean),as.data.frame.matrix(table(df1[-2])))
Program Age Eng F Kor M Other
A A 23.33333 2 2 1 1 0
B B 22.00000 0 0 1 2 1
C C 53.00000 0 1 0 0 1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.