[英]Matrix Operations with Specific Columns in data.frame
我有一个来自Qualtrics调查的松散数据集。 看起来像这样:
V3 Q8_42 Q8_33 Q8_72 Q8_38 Q13_1_42 Q13_1_33 Q13_1_72 Q13_1_38
Chap A . 1 . . . 4 . .
Chap B 1 . . . 4 . . .
Chap C . . . . . . . .
Chap D . . . . . . . .
快照显示了四个人,询问他们是否是朋友(q8_42是A; q8_33是B,q8_72是C,q8_38是D)。 如果有人说他们是朋友,那么他们会以1-5的比例询问他们的友谊强度(q13_1_42代表A,q13_1_33代表B,q13_1_72代表C,q13_1_38代表D)。 我总共有95个人,向他们提出的所有9个问题都是:他们的友谊。 我应该如何运行矩阵运算,以便最终得到以下矩阵,每个友情问题为1:
Chap A Chap B Chap C Chap D
Chap A 0 4 . .
Chap B 4 0 . .
Chap C . . 0 .
Chap D . . . 0
我的解决方案是将数据(名为“ kolp”)读入R,然后运行
Chap.A <- (kolp$q8_42 * kolp$q13_1_42)
Chap.B <- (kolp$q8_33 * kolp$q13_1_33)
Chap.C <- (kolp$q8_72 * kolp$q13_1_72)
Chap.D <- (kolp$q8_38 * kolp$q13_1_38)
Mat.1 <- cbind(Chap.A, Chap.B, Chap.C, Chap.D)
rownames(Mat.1) <- c("Chap.A", "Chap.B", "Chap.C", "Chap.D")
这给我
Chap.A Chap.B Chap.C Chap.D
Chap.A NA 4 NA NA
Chap.B 4 NA NA NA
Chap.C NA NA NA NA
Chap.D NA NA NA NA
但是我知道这是处理问题的笨拙方法,尤其是可以将9个矩阵提取为* .csv或* .txt文件,且暗淡为95x95
假设列的格式为“ questionID_individualID”,则可以尝试使用以下函数来处理数据:
f <- function(dat)
{
n <- names(dat)
id <- substring(n, nchar(n)-1)
qu_id <- substring(n, 1, nchar(n)-3)
individuals <- sort(unique(id))
questions <- unique(qu_id)
result <- 1
for(q in questions)
{
filter <- qu_id==q
result <- result * dat[,filter][,match(individuals, id[filter])]
}
result
colnames(result) <- individuals
result
}
用作f(kolp)
。 即使列出现故障也可以使用。 但是,如果某些问题没有针对所有个人的专栏,它将失败(或给出错误的结果)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.