簡體   English   中英

如何在R中使用grep函數根據樣本名稱查找相關性

[英]How to use grep function in R to find the correlation based on sample names

我有兩個包含有關基因信息的數據框。 這兩個數據幀具有相同的尺寸(20,000行x 50列)。 我還有一個名為info的文件,其中包含這些數據框之間匹配的主題名稱。 我想從文件(信息)中提取名稱,以找到匹配主題之間的相關系數。 這是這些文件的示例:

df1
gene_name    loc1  loc2 .........  loc50
gene1        1        23              25
gene2        24       15              67

df2
gene_name    loc1  loc2 .........  loc50
gene1        21       31              55
gene2        2       65              89

info file
subject     loc_in_df1   loc_in_df2
1                loc1          loc2
2                loc3          loc46   

試試下面的東西

首先根據信息文件,使用從df1df2提取的列建立一個df

df <- cbind(df1[, info$loc_in_df1],df2[, info$loc_in_df2]) 

cor = apply(df, MARGIN = 1, FUN = function(x) return(cor.test(x[1:50], x[51:100])$estimate))

1:50和51:100假設您的信息文件中有50個配對,但這只是猜測,因為您沒有提供可重復的樣本

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM