繁体   English   中英

python pandas read_csv无法识别制表符分隔文件中的\\ t

[英]python pandas read_csv not recognizing \t in tab delimited file

我正在尝试将以下标签中的数据分成大熊猫:
的test.txt:

col_a\tcol_b\tcol_c\tcol_d
4\t3\t2\t1  
4\t3\t2\t1 

我导入test.txt如下:

pd.read_csv('test.txt',sep='\t')

结果数据框有1列。 \\ t不会被识别为选项卡。

如果我用'键盘选项卡'替换\\ t,则正确解析文件。 我也尝试用\\ t和/ t替换'\\ t',但没有任何运气。

在此先感谢您的帮助。
奥马尔

PS:截图http://imgur.com/a/nXvW3

你文件中的\\t是一个实际的反斜杠后跟一个t 不是 tab 您将不得不在sep参数上使用一些转义字符。

pd.read_csv('test.txt', sep=r'\\t', engine='python')

   col_a  col_b  col_c  col_d
0      4      3      2      1
1      4      3      2      1

要么

pd.read_csv('test.txt', sep='\\\\t', engine='python')

   col_a  col_b  col_c  col_d
0      4      3      2      1
1      4      3      2      1

回应评论

r表示它是一个原始字符串,特殊字符应该被解释为原始字符。 这就是为什么在一个解决方案中我指出字符串是原始的并且只有两个反斜杠。 在另一方面,我不得不用另一个反斜杠逃避每个反斜杠,留下四个反斜杠。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM