簡體   English   中英

無法在R中使用read.table或read.csv讀取帶有“#”和空格的文件

[英]Cannot read file with “#” and space using read.table or read.csv in R

我有一個文件,其中第一行是標題。 標頭可以包含空格和#符號(也可以有其他特殊字符)。 我正在嘗試使用read.csv或read.table讀取此文件,但它不斷拋出錯誤:

undefined columns selected 

more columns than column names 

我的制表符分隔的chromFile文件看起來像:

Chromosome# Chr chr Size    UCSC NCBI36/hg18    NCBIBuild36 NCBIBuild37
1   Chr1    chr1    247199719   247249719   247249719   249250621
2   Chr2    chr2    242751149   242951149   242951149   243199373

命令:

chromosomes <- read.csv(chromFile, sep="\t",skip =0, header = TRUE,  )

我想首先尋找一種讀取文件的方式,而不用其他可讀符號替換空格或#。

從文檔( ?read.csv ):

comment.char character:長度為一個的字符向量,包含一個字符或一個空字符串。 使用“”可以完全關閉注釋的解釋。

默認值為comment.char = "#" ,這comment.char = "#"您帶來麻煩。 根據文檔,您應該使用comment.char = ""

如mrdwab所指出,標頭中的空格是另一個問題,可以通過設置check.names = FALSE來解決。

chromosomes <- read.csv(chromFile, sep = "\t", skip = 0, header = TRUE,
                        comment.char = "", check.names = FALSE)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM