[英]Create variable based on counts of groups and sub groups in data table
我有很多學生記錄。 我需要創建兩個新變量。 應該顯示每個Year
每個student_ID
的Unitcode
(即注冊)計數。
應該顯示每個Year
每個student_ID
的Fail
計數(即 Grade=='Fail')。 請參閱以下三個學生的記錄示例:
student_ID=c(rep("1001",8),rep("1002",3),rep("1005",11))
Year=c(rep(2011,4),rep(2012,4),2011,2012,2013,rep(2011,4),rep(2012,3),rep(2013,4))
Grade=c(rep("Fail",2),rep("Pass",3),rep("Fail",3),rep("Pass",7),rep("Fail",2),rep("Pass",5))
Unitcode<-c(1201:1222)
record<-data.table(student_ID, Year, Grade, Unitcode)
如果有人可以協助計算新變量,將不勝感激。
使用dplyr
的類似選項是
library(dplyr)
record %>%
group_by(student_ID, Year) %>%
summarise(unitcodes=n(), fails=sum(Grade=='Fail'))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.