繁体   English   中英

从制表符分隔的.txt文件中将包含空格的字符串读取到R中

[英]Reading strings that contain whitespace into R from tab delimited .txt file

我有一个制表符分隔的文本文件,其中包含包含空格的字符串名称。 它是python例程的输出。 文本文件看起来像这样,带有隐藏的'\\ t'字符。

Mother's Day    Breakfast in Bed    Breakfast in Bed    Arkadia Tea Chai Spice 240g 6.69    False
Mother's Day    Breakfast in Bed    Breakfast in Bed    Coles Crumpets 6 pack   2.29    False
Mother's Day    Entertainment   Entertainment   4 Ingredients Book 1 by Kim McCosker & Rachael Bermingham 1 each    14.00   False
Pantry  Baking  Cake Mix    White Wings Red Velvet Cake 425g    4.61    False

由于文件是制表符分隔的,例如,excel-可以识别出六列,这正是我所希望的。

我希望它位于R的表中,该表具有六列,并将这些列视为因素。

我已经阅读了文档,似乎指定分隔符应该可以工作-但是我无法通过以下方法来工作:

fullSurvey <- read.table(file="C:/1.txt", check.names=FALSE, header=FALSE, sep="\t", stringsAsFactors=TRUE)

它返回:

Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
line 2 did not have 15 elements

在R中这可能吗?

(将评论添加到答案中,希望将其标记为已解决)。

通常,当输入用制表符分隔时,您可以尝试使用read.delim ,这与用于csv文件的read.csv一样,对于read.table通常具有合理的默认值。

当您的数据包含撇号,单引号或双引号时,您可能需要指定用于引号字符的值,或指定quote = ""以保留嵌入的引号。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM