[英]Read Non-Delimited .txt file into R
我得到了二进制数据的数据集,表明虚拟测试的正确/错误测试答案。 我将这些数据导入到R中以对其进行分析。
我很难将数据集导入R而没有R将每行中的值更改为单个大数字。 我最初的信念是缺乏划界字符会引起我的问题。
.txt文件的前几行显示如下:
11011111110001100000001110000010
11111100110000001010001000100000
00001011110000000000000010001000
11110101000101100111000100000110
10000000100000100101000000101000
11111110001000001001000010000000
当我将这些行读入R时,我收到:
1.101111e + 31
1.111110e + 31
1.011110e + 27
1.111010e + 31
1.000000e + 31
1.111111e + 31
而不是表示测试结果的1s和0s的行。
我猜每行都是观察? 例如,每行包含学生32个答案的正确性。 如果是这种情况,请尝试read.fwf
:
my.data <- "11011111110001100000001110000010
11111100110000001010001000100000
00001011110000000000000010001000
11110101000101100111000100000110
10000000100000100101000000101000
11111110001000001001000010000000"
test.results <- read.fwf(textConnection(my.data), widths=rep(1, 32))
test.results[1, ]
# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24
# 1 1 1 0 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 0 0 0 0 1 1
# V25 V26 V27 V28 V29 V30 V31 V32
# 1 1 0 0 0 0 0 1 0
如果不是这样,您应该提供更多信息。
您需要指定数据是字符。 R
很聪明,并把它当作一个数字。 在read.table
使用colClasses
...
read.table( text = "11011111110001100000001110000010
11111100110000001010001000100000
00001011110000000000000010001000
11110101000101100111000100000110
10000000100000100101000000101000
11111110001000001001000010000000" , colClasses = "character" , h = FALSE )
# V1
#1 11011111110001100000001110000010
#2 11111100110000001010001000100000
#3 00001011110000000000000010001000
#4 11110101000101100111000100000110
#5 10000000100000100101000000101000
#6 11111110001000001001000010000000
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.