将非分隔的.txt文件读入R中

Question

我得到了二进制数据的数据集，表明虚拟测试的正确/错误测试答案。 我将这些数据导入到R中以对其进行分析。

我很难将数据集导入R而没有R将每行中的值更改为单个大数字。 我最初的信念是缺乏划界字符会引起我的问题。

.txt文件的前几行显示如下：

11011111110001100000001110000010

11111100110000001010001000100000

00001011110000000000000010001000

11110101000101100111000100000110

10000000100000100101000000101000

11111110001000001001000010000000

当我将这些行读入R时，我收到：

1.101111e + 31

1.111110e + 31

1.011110e + 27

1.111010e + 31

1.000000e + 31

1.111111e + 31

而不是表示测试结果的1s和0s的行。

Answer 1

我猜每行都是观察？ 例如，每行包含学生32个答案的正确性。 如果是这种情况，请尝试read.fwf ：

my.data <- "11011111110001100000001110000010
11111100110000001010001000100000
00001011110000000000000010001000
11110101000101100111000100000110
10000000100000100101000000101000
11111110001000001001000010000000"

test.results <- read.fwf(textConnection(my.data), widths=rep(1, 32))

test.results[1, ]
# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24
# 1  1  1  0  1  1  1  1  1  1   1   0   0   0   1   1   0   0   0   0   0   0   0   1   1
# V25 V26 V27 V28 V29 V30 V31 V32
# 1   1   0   0   0   0   0   1   0

如果不是这样，您应该提供更多信息。

Answer 2

您需要指定数据是字符。 R很聪明，并把它当作一个数字。 在read.table使用colClasses ...

read.table( text = "11011111110001100000001110000010
11111100110000001010001000100000
00001011110000000000000010001000
11110101000101100111000100000110
10000000100000100101000000101000
11111110001000001001000010000000" , colClasses = "character" , h = FALSE )

#                                V1
#1 11011111110001100000001110000010
#2 11111100110000001010001000100000
#3 00001011110000000000000010001000
#4 11110101000101100111000100000110
#5 10000000100000100101000000101000
#6 11111110001000001001000010000000

将非分隔的.txt文件读入R中

问题描述

2 个解决方案

解决方案1
9 2013-09-17 13:41:38

解决方案2
2 已采纳 2013-09-17 13:41:40

将非分隔的.txt文件读入R中

问题描述

2 个解决方案

解决方案1 9 2013-09-17 13:41:38

解决方案2 2 已采纳 2013-09-17 13:41:40

解决方案1
9 2013-09-17 13:41:38

解决方案2
2 已采纳 2013-09-17 13:41:40