R 中的 fread data.table 不讀取列名

Question

將數據文件讀入 R 時，我可以使用data.table包將其作為data.frame或data.table讀data.table 。 我希望將來使用data.table ，因為它可以更好地處理大數據。 但是，這兩種方法都存在問題（data.frames 為read.table ，data.tables 為fread ），我想知道是否有一個簡單的修復方法。

當我使用read.table生成data.frame ，如果我的列名包含冒號或空格，它們會被句點替換，這是我不想要的。 我希望以“原樣”讀取列名。

或者，當我使用fread生成data.table ，我的列名根本沒有讀入，這顯然是不希望的。

查看下面的要點以獲取可重現的示例：

https://gist.github.com/jeffbruce/b966d41eedc2662bbd4a

干杯

Answer 1

這是一個可能有效的解決方案。 我不確定這是否是最短的解決方案，或者您可以通過巧妙地使用數據表中的drop來實現，但是下面的 hack 確實有效。 “問題”是文件中的行號。

先讀入頭文件，然后添加到數據表中

header <- read.table("yourfile.csv", header = TRUE, nrow = 1)
indata <- fread("yourfile.csv", skip=1, header=FALSE)
setnames(indata, colnames(header))

Answer 2

R 總是嘗試轉換列名以確保它們是有效的變量名，因此它會添加句點來代替空格和冒號。 如果你不想要，你可以在使用read.table使用check.names=FALSE

df1<-read.table("data.txt",check.names = FALSE)

sample(colnames(df1),10)
 [1] "simple lobule white matter"                       
 [2] "anterior lobule white matter"                     
 [3] "hippocampus"                                      
 [4] "lateral olfactory tract"                          
 [5] "lobules 1-2: lingula and central lobule (ventral)"
 [6] "Medial parietal association cortex"               
 [7] "Primary somatosensory cortex: trunk region"       
 [8] "midbrain"                                         
 [9] "Secondary auditory cortex: ventral area"          
[10] "Primary somatosensory cortex: forelimb region"

您可以看到colnames保持原樣。

R 中的 fread data.table 不讀取列名

問題描述

2 個解決方案

解決方案1
10 2015-09-24 19:06:40

解決方案2
6 已采納 2015-09-24 19:19:22

R 中的 fread data.table 不讀取列名

問題描述

2 個解決方案

解決方案1 10 2015-09-24 19:06:40

解決方案2 6 已采納 2015-09-24 19:19:22

解決方案1
10 2015-09-24 19:06:40

解決方案2
6 已采納 2015-09-24 19:19:22