使用 R 指定 row.name 打开 CSV 文件时出错

Question

我有一个大 df（CSV 格式），如下所示：

miRNAs <- c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-6-5p','mmu-mir-6-3p')
cca <- c('12854','5489','54485','2563')
ccb <- c('124','589','5465','25893')
taa <- c('12854','589','5645','763')
df <- data.frame(miRNAs,cca,ccb,taa)

我想在 DESeq2 分析中使用这个 df。 我通过使用unique(df)使这个 df 独一无二，并尝试使用countData <- as.matrix(read.csv(file="df.csv", row.name="miRNAs", sep = ","))打开但它给出了这个错误

read.table(file = file, header = header, sep = sep, quote = quote, 中的错误：不允许重复的“row.names”

由于我使 df unique我不知道为什么这个错误不断弹出。 基本上，我想以这种方式读取 df 的原因是，当我键入colnames(df)时，我想获取列标题的列表(except the first column) colnames(df) 。 因为我需要做 FALSE TRUE 测试以查看这些匹配是否与另一个名为 phenotype.csv all(rownames(phenotype) == colnames(countData))文件的行名称匹配

Answer 1

在row.name="miRNAs"参数中，您没有访问相应的列，而是使用长度为 1 的字符向量。 然后被回收，这就是你得到错误的原因。 不带row.names参数导入，如果您真的希望该变量作为行名称而不是列，请在导入后执行此操作：

df <- data.frame(
  miRNAs = c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-6-5p','mmu-mir-6-3p'),
  cca = c('12854','5489','54485','2563'),
  ccb = c('124','589','5465','25893'),
  taa = c('12854','589','5645','763')
  )

rownames(df) <- df$miRNAs
df$miRNAs <- NULL
df
#>                cca   ccb   taa
#> mmu_mir-1-3p 12854   124 12854
#> mmu_mir-1-5p  5489   589   589
#> mmu-mir-6-5p 54485  5465  5645
#> mmu-mir-6-3p  2563 25893   763

^{由reprex 包(v0.3.0) 于 2020 年 2 月 19 日创建}

使用 R 指定 row.name 打开 CSV 文件时出错

问题描述

1 个解决方案

解决方案1
1 2020-02-19 12:03:32

使用 R 指定 row.name 打开 CSV 文件时出错

问题描述

1 个解决方案

解决方案1 1 2020-02-19 12:03:32

解决方案1
1 2020-02-19 12:03:32