data.frame中具有特定列的矩阵运算

Question

我有一个来自Qualtrics调查的松散数据集。 看起来像这样：

V3       Q8_42  Q8_33  Q8_72   Q8_38  Q13_1_42 Q13_1_33 Q13_1_72 Q13_1_38
Chap A     .    1       .        .       .      4        .        .
Chap B     1    .       .        .       4      .        .        .
Chap C     .    .       .        .       .      .        .        .
Chap D     .    .       .        .       .      .        .        .

快照显示了四个人，询问他们是否是朋友（q8_42是A； q8_33是B，q8_72是C，q8_38是D）。 如果有人说他们是朋友，那么他们会以1-5的比例询问他们的友谊强度（q13_1_42代表A，q13_1_33代表B，q13_1_72代表C，q13_1_38代表D）。 我总共有95个人，向他们提出的所有9个问题都是：他们的友谊。 我应该如何运行矩阵运算，以便最终得到以下矩阵，每个友情问题为1：

       Chap A   Chap B  Chap C  Chap D
Chap A  0       4       .       .
Chap B  4       0       .       .
Chap C  .       .       0       .
Chap D  .       .       .       0

我的解决方案是将数据（名为“ kolp”）读入R，然后运行

Chap.A <- (kolp$q8_42 * kolp$q13_1_42)
Chap.B <- (kolp$q8_33 * kolp$q13_1_33)
Chap.C <- (kolp$q8_72 * kolp$q13_1_72)
Chap.D <- (kolp$q8_38 * kolp$q13_1_38)
Mat.1 <- cbind(Chap.A, Chap.B, Chap.C, Chap.D)
rownames(Mat.1) <- c("Chap.A", "Chap.B", "Chap.C", "Chap.D")

这给我

         Chap.A Chap.B Chap.C Chap.D
Chap.A     NA      4     NA     NA
Chap.B      4     NA     NA     NA
Chap.C     NA     NA     NA     NA
Chap.D     NA     NA     NA     NA

但是我知道这是处理问题的笨拙方法，尤其是可以将9个矩阵提取为* .csv或* .txt文件，且暗淡为95x95

Answer 1

假设列的格式为“ questionID_individualID”，则可以尝试使用以下函数来处理数据：

f <- function(dat)
{
    n <- names(dat)

    id <- substring(n, nchar(n)-1)

    qu_id <- substring(n, 1, nchar(n)-3)

    individuals <- sort(unique(id))

    questions <- unique(qu_id)

    result <- 1

    for(q in questions)
    {
        filter <- qu_id==q

        result <- result * dat[,filter][,match(individuals, id[filter])]
    }

    result

    colnames(result) <- individuals

    result
}

用作f(kolp) 。 即使列出现故障也可以使用。 但是，如果某些问题没有针对所有个人的专栏，它将失败（或给出错误的结果）。

data.frame中具有特定列的矩阵运算

问题描述

1 个解决方案

解决方案1
0 2013-03-27 20:45:36

data.frame中具有特定列的矩阵运算

问题描述

1 个解决方案

解决方案1 0 2013-03-27 20:45:36

解决方案1
0 2013-03-27 20:45:36