簡體   English   中英

在R中導入文本文件

[英]Importing text file in r

我有26MB的文本文件,其中包含21個變量,我嘗試將數據導入為:

file<-read.table("file.txt", header=FALSE, sep="\t",skip=10)

由於某種原因,它使用一個變量加載了數據。 任何建議表示贊賞?

我的sessionInfo看起來像:

sessionInfo()
R version 3.0.1 (2013-05-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)

編輯:這是一些數據:

8760
201001010100
201001010100
00001    -9.0
00002   18
    201001010100      00002     0.0000        100.0000        250.0000        500.0000        750.0000       1000.0000       1500.0000       2000.0000       3000.0000       4000.0000       5000.0000       6000.0000       7500.0000       8500.0000      10000.0000      12000.0000      15000.0000      18000.0000
    201001010100      00002     86.8757         89.1179         90.9795         97.8640         99.0000         99.0000         99.0000         99.0000         99.0000         98.5143         86.4022         83.7819         63.1753         63.1753         15.9124         15.9124        0.500000        0.500000    
    201001010200      00002     91.2323         93.8417         95.9578         99.0000         99.0000         99.0000         99.0000         99.0000         99.0000         98.9829         88.4616         82.8682         59.4900         59.4900         16.8052         16.8052        0.500000        0.500000    
    201001010300      00002     94.3013         97.2262         99.0000         99.0000         99.0000         99.0000         98.6965         99.0000         99.0000         99.0000         87.7681         85.6374         51.5871         51.5871         19.4833         19.4833        0.500000        0.500000    
    201001010400      00002     95.2143         98.3831         99.0000         99.0000         98.9409         97.9819         99.0000         99.0000         98.6090         89.6825         85.1337         84.1001         47.7453         47.7453         20.1295         20.1295        0.500000        0.500000    
    201001010500      00002     94.9904         98.2644         99.0000         97.4757         94.7400         96.5887         99.0000         99.0000         98.1337         89.6765         88.0377         80.0048         47.3583         47.3583         23.5985         23.5985        0.500000        0.500000    

您似乎有不同的Nr。 在你的文件(21超出線5線5號線VS 20)列。

類似於@thepule建議,用read.table你可以離開了sep參數完全和read.table通常由自動做一些合理的給你很好的效果。 在你的情況下,離開了線1-5,這導致8號線與20個變量:

> f <- read.table('file.txt', header=FALSE, skip=5) 
> str(f)

 data.frame':   8 obs. of  20 variables:
 $ V1 : num  2.01e+11 2.01e+11 2.01e+11 2.01e+11 2.01e+11 ...
 $ V2 : int  2 2 2 2 2 2 2 2
 $ V3 : num  86.9 91.2 94.3 95.2 95 ...
 [...]

設置sep=''可以跳過列之間的所有空白,在您的情況下也可以。

編輯:如果你每行有不同的量柱(=元素)你可以考慮設置fill=Tread.table 這將用空白字段填充缺少的信息-但請確保這是您真正想要做的。

PS: file將是一個函數,所以我建議使用其他名稱為您的變量。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM