[英]Reading strings that contain whitespace into R from tab delimited .txt file
我有一个制表符分隔的文本文件,其中包含包含空格的字符串名称。 它是python例程的输出。 文本文件看起来像这样,带有隐藏的'\\ t'字符。
Mother's Day Breakfast in Bed Breakfast in Bed Arkadia Tea Chai Spice 240g 6.69 False
Mother's Day Breakfast in Bed Breakfast in Bed Coles Crumpets 6 pack 2.29 False
Mother's Day Entertainment Entertainment 4 Ingredients Book 1 by Kim McCosker & Rachael Bermingham 1 each 14.00 False
Pantry Baking Cake Mix White Wings Red Velvet Cake 425g 4.61 False
由于文件是制表符分隔的,例如,excel-可以识别出六列,这正是我所希望的。
我希望它位于R的表中,该表具有六列,并将这些列视为因素。
我已经阅读了文档,似乎指定分隔符应该可以工作-但是我无法通过以下方法来工作:
fullSurvey <- read.table(file="C:/1.txt", check.names=FALSE, header=FALSE, sep="\t", stringsAsFactors=TRUE)
它返回:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 2 did not have 15 elements
在R中这可能吗?
(将评论添加到答案中,希望将其标记为已解决)。
通常,当输入用制表符分隔时,您可以尝试使用read.delim
,这与用于csv文件的read.csv
一样,对于read.table
通常具有合理的默认值。
当您的数据包含撇号,单引号或双引号时,您可能需要指定用于引号字符的值,或指定quote = ""
以保留嵌入的引号。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.