[英]Combining and appending columns of different lengths, by row number, R
我正在处理受试者的生化数据,按性别分析结果。 我有19种生化测试可对两种药物的每种性别进行分析(稍后将进行血液学和解剖学测试)。
出于结果可重复性和防止转录错误的原因,我尝试将每个测试汇总到一个表中。 在表格输出中,我需要一列用于Dunnett事后比较p值。 因为Dunnett检验与对照结果比较,在对照和3种药物水平下,我只得到3个p值。 但是,我有4个均值和sd值。
使用ddply来获取均值和sd结果(由于有效数字的数量有限,我得到了一个数据集,如下所示:
Sex<- c(rep("F",4), rep("M",4))
Druglevel <- c(rep(0:3,2))
Sample <- c(rep(10,8))
Mean <- c(0.44, 0.50, 0.46, 0.49, 0.48, 0.55, 0.47, 0.57)
sd <- c(0.07, 0.07, 0.09, 0.12, 0.18, 0.19, 0.13, 0.41)
Drug1Biochem1 <- data.frame(Sex, Druglevel, Sample, Mean, sd)
我已经在软件包multcomp
使用glht
,对通过执行普通aov
构造的aov
对象执行Dunnett测试。 我从glht
摘要中提取了p值(将这些值四舍五入到小数点后三位)。 男性和女性分析是使用独立的ANOVA
因此对于每种性别,我都有一组输出。 女性的结果是:
femaleR <- c(0.371, 0.973, 0.490)
男性结果为:
maleR <- c(0.862, 0.999, 0.738)
如何将一列p值附加到原始数据框(Drug1Biochem1),以便femaleR和maleR都在该最后一列中,而该列的第1行和第5行为空(即,控件没有p值) ?
我希望将结果组合输出到html,可以将其插入到Word文档中,因此不会发生转录错误。 我设置了一个种子值,以便程序的结果可再现(当我最终停止调试时)。
总而言之,我想要一个具有以下格式的数据框(或表,或任何我可以输出到html的东西):
Sex Druglevel Sample Mean sd p-value
F 0 10 0.44 0.07
F 1 10 0.50 0.07 0.371
F 2 10 0.46 0.09 0.973
F 3 10 0.49 0.12 0.480
M 0 10 0.48 0.18
M 1 10 0.55 0.19 0.862
M 2 10 0.47 0.13 0.999
M 3 10 0.57 0.41 0.738
对于每个测试,我希望重现此精确表。 每种性别始终有4组,并且控件永远没有p值,该值将始终在第1行(F)和第5行(M)中进行汇总。
您可以尝试merge
dN <- data.frame(Sex=rep(c('M', 'F'), each=3), Druglevel=1:3,
pval=c(maleR, femaleR))
merge(Drug1Biochem1, dN, by=c('Sex', 'Druglevel'), all=TRUE)
# Sex Druglevel Sample Mean sd pval
#1 F 0 10 0.44 0.07 NA
#2 F 1 10 0.50 0.07 0.371
#3 F 2 10 0.46 0.09 0.973
#4 F 3 10 0.49 0.12 0.490
#5 M 0 10 0.48 0.18 NA
#6 M 1 10 0.55 0.19 0.862
#7 M 2 10 0.47 0.13 0.999
#8 M 3 10 0.57 0.41 0.738
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.