结合数据中的图表并创建图表列表 R

Question

我认为这可能是一个简单的解决方法，但我无法让它工作。 这是一个 R-shiny 应用程序，它有两个结构如下的输入数据集：

d1 <- data.frame(A1 = rnorm(10),
             A2 = rnorm(10),
             A3 = rnorm(10),
             B1 = rnorm(10),
             B2 = rnorm(10),
             B3 = rnorm(10),
             C1 = rnorm(10),
             C2 = rnorm(10),
             C3 = rnorm(10),
             Names = c("A", "B", "C", "D", "E",
                       "F", "G", "H", "I", "J"))

虽然此数据以逻辑方式构建，表示相同样本的重复，但这并不能保证在所有情况下，输入因用户而异。 因此，我提示输入一个索引来指示哪些列是相关的（即它们具有相同的名称），这给出了一个如下所示的数据框：

d2 <- data.frame(ID = c("A1", "A2", "A3", 
                    "B1", "B2", "B3",
                    "C1", "C2", "C3"),
             Anno = c(rep("A", 3), 
                      rep("B", 3),
                      rep("C", 3)), stringsAsFactors = FALSE)

我可以使用这种方法用散点图将每个样本与其他样本进行比较

plot_combinations = combn(names(d1)[1:ncol(d1)-1], 
                      2, 
                      simplify = FALSE)
plot_list <- list()
plot.col = "black"
for (i in 1:length(plot_combinations)) {
  p = ggplot(d1, 
             aes_string(x = plot_combinations[[i]][1], 
                        y = plot_combinations[[i]][2])) +
    geom_point(pch = 21, colour = "black", fill = plot.col) +
    theme_classic(base_size = 14)
  plot_list[[i]] = p
}

虽然原则上这是可行的，但它是不可行的，因为对于一个小数据集，这已经是 36 种组合。 更有意义的是在重复中进行比较。 为了做到这一点，我可以重命名d1的列并获取每个复制的频率并将其保存在变量sampleFreq中，并通过循环遍历复制名称来提取数据，如下所示：

anno <- d2$Anno
d3 <- d1[,1:nrow(d1)-1]
colnames(d3) <- anno
sampleFreq <- as.data.frame(table(d2[,2]))
datalist <- list()
for (i in sampleFreq[, 1]) {
  d4 <- d3[, i == names(d3)]
  datalist[[i]] = d4
}

这给了我一个由复制结构的数据框列表，我想从中创建一个散点图列表。 我尝试过 for 循环，但遇到了问题，我认为可能有一个 lapply 解决方案，但我被卡住了。 这个想法是然后使用由在 shiny 中单击按钮的次数确定的索引号从 plot 列表中调用图。

任何帮助都是极好的

谢谢！

Answer 1

每个复制组中的一对 plot 不能做什么？ 我们可以从您的数据开始，我尽量不要将 d1 中的列重命名为 d3（就像您所做的那样）

d1 <- data.frame(A1 = rnorm(10),
             A2 = rnorm(10),
             A3 = rnorm(10),
             B1 = rnorm(10),
             B2 = rnorm(10),
             B3 = rnorm(10),
             C1 = rnorm(10),
             C2 = rnorm(10),
             C3 = rnorm(10),
             Names = c("A", "B", "C", "D", "E",
                       "F", "G", "H", "I", "J"))

d2 <- data.frame(ID = c("A1", "A2", "A3", 
                    "B1", "B2", "B3",
                    "C1", "C2", "C3"),
             Anno = c(rep("A", 3), 
                      rep("B", 3),
                      rep("C", 3)), stringsAsFactors = FALSE)

我们 go 通过所有重复：

pdf(<somefilename.pdf>)
for(i in unique(d2$Anno)){
COLS=d2$ID[d2$Anno ==i]
pairs(d1[,COLS],upper.panel=NULL)
}
dev.off()

看起来像这样，但它（血腥）快

或者你可以使用GGally，

library(GGally)

plots <- lapply(unique(d2$Anno),function(i){

    COLS=as.character(d2$ID[d2$Anno ==i])
    return(ggscatmat(d1[,d2$Anno %in% i]))
    })

plots[[1]]

结合数据中的图表并创建图表列表 R

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-11-15 11:34:30

结合数据中的图表并创建图表列表 R

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-11-15 11:34:30

解决方案1
1 已采纳 2019-11-15 11:34:30