[英]How to use grep function in R to find the correlation based on sample names
我有兩個包含有關基因信息的數據框。 這兩個數據幀具有相同的尺寸(20,000行x 50列)。 我還有一個名為info的文件,其中包含這些數據框之間匹配的主題名稱。 我想從文件(信息)中提取名稱,以找到匹配主題之間的相關系數。 這是這些文件的示例:
df1
gene_name loc1 loc2 ......... loc50
gene1 1 23 25
gene2 24 15 67
df2
gene_name loc1 loc2 ......... loc50
gene1 21 31 55
gene2 2 65 89
info file
subject loc_in_df1 loc_in_df2
1 loc1 loc2
2 loc3 loc46
試試下面的東西
首先根據信息文件,使用從df1
和df2
提取的列建立一個df
df <- cbind(df1[, info$loc_in_df1],df2[, info$loc_in_df2])
和
cor = apply(df, MARGIN = 1, FUN = function(x) return(cor.test(x[1:50], x[51:100])$estimate))
1:50和51:100假設您的信息文件中有50個配對,但這只是猜測,因為您沒有提供可重復的樣本
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.