簡體   English   中英

將一個變量與 r 中的多個變量相關聯

[英]correlate a variable with multiple variables in r

我需要將一個基因與 47,000 個其他基因相關聯,以找到 10 條最佳相關曲線。 通常,我的數據框在第一列中包含基因名稱,在下一列中包含患者數據,在第一行中包含基因名稱。 我是否需要轉置數據框來進行相關測試? 如果我轉置,它可以工作,但我相信有一種更簡單的方法可以做到這一點。 有人可以幫助我嗎?

在此處輸入圖像描述

pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)

vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)

library(tidyverse)

df_cor %>%
  arrange(cor)

df_cor %>%
  arrange(desc(cor)) %>% 
  head(n = 10)

如果要計算基因之間的相關性(數據框中的行),則需要轉置數據框,嘗試使用此方法來計算基因之間的相關性

correlation_btw_genes = cor(pancreas_final_t)

如果您不轉置您的 dataframe cor() function 將計算您的患者之間的相關性

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM