用数据框中的另一列标记x轴

Question

我有一个从运行的GWAS的输出派生的数据框。 每行都是基因组中的SNP，具有染色体，位置和P.value。 从这个数据框中，我想生成一个曼哈顿图，其中x轴从Chr 1上的第一个SNP到Chr 5上的最后一个SNP，而y轴是-log10（P.value）。 为此，我生成了一个Index列以沿x轴以正确顺序绘制SNP，但是，我希望x轴由染色体列而不是Index标记。 不幸的是，我不能使用染色体来绘制我的x轴，因为任何给定染色体上的所有SNP都将被绘制在一个点列中。

这是一个可以使用的示例数据框：

library(tidyverse)

df <- tibble(Index = seq(1, 500, by = 1),
             Chromosome = rep(seq(1, 5, by = 1), each = 100),
             Position = rep(seq(1, 500, by = 5), 5),
             P.value = sample(seq(1e-5, 1e-2, by = 1e-5), 500, replace = TRUE))

到目前为止，我的情节是：

df %>%
    ggplot(aes(x = Index, y = -log10(P.value), color = as.factor(Chromosome))) +
    geom_point()

我尝试过使用scale_x_discrete选项，但是还没有找到解决方案。

这是我在网上找到的曼哈顿情节的示例。 看看如何根据染色体标记x轴？ 那是我想要的输出。

曼哈顿情节示例

Answer 1

geom_jitter是您的朋友：

df %>%
    ggplot(aes(x = Chromosome, y = -log10(P.value), color = as.factor(Chromosome))) +
    geom_jitter()

编辑给定OP的评论：

使用基数R图，您可以执行以下操作：

cols = sample(colors(), length(unique(df$Chromosome)))[df$Chromosome]

plot(df$Index, -log10(df$P.value), col=cols, xaxt="n")
axis(1, at=c(50, 150, 250, 350, 450), labels=c(1:5))

您需要确切指定每个染色体标签在axis功能中的位置。 感谢这篇文章。

编辑＃2：

我使用ggplot2找到了答案。 您可以使用annotate功能按坐标绘制点，并使用scale_x_discrete函数（如您建议的那样）根据染色体将标签放置在x轴上。 我们还需要定义pos向量以获取图的标签位置。 我以每个组的“ Index列的平均值为例，但是您可以根据需要手动定义它。

pos <- df %>% 
    group_by(Chromosome) %>% 
    summarize(avg = round(mean(Index))) %>% 
    pull(avg)

ggplot(df) +
    annotate("point", x=df$Index, y=-log10(df$P.value),
          color=as.factor(df$Chromosome)) +
    scale_x_discrete(limits = pos, 
          labels = unique(df$Chromosome))

用数据框中的另一列标记x轴

问题描述

1 个解决方案

解决方案1
2 已采纳 2019-08-23 13:14:47

用数据框中的另一列标记x轴

问题描述

1 个解决方案

解决方案1 2 已采纳 2019-08-23 13:14:47

解决方案1
2 已采纳 2019-08-23 13:14:47