簡體   English   中英

python pandas read_csv無法識別制表符分隔文件中的\\ t

[英]python pandas read_csv not recognizing \t in tab delimited file

我正在嘗試將以下標簽中的數據分成大熊貓:
的test.txt:

col_a\tcol_b\tcol_c\tcol_d
4\t3\t2\t1  
4\t3\t2\t1 

我導入test.txt如下:

pd.read_csv('test.txt',sep='\t')

結果數據框有1列。 \\ t不會被識別為選項卡。

如果我用'鍵盤選項卡'替換\\ t,則正確解析文件。 我也嘗試用\\ t和/ t替換'\\ t',但沒有任何運氣。

在此先感謝您的幫助。
奧馬爾

PS:截圖http://imgur.com/a/nXvW3

你文件中的\\t是一個實際的反斜杠后跟一個t 不是 tab 您將不得不在sep參數上使用一些轉義字符。

pd.read_csv('test.txt', sep=r'\\t', engine='python')

   col_a  col_b  col_c  col_d
0      4      3      2      1
1      4      3      2      1

要么

pd.read_csv('test.txt', sep='\\\\t', engine='python')

   col_a  col_b  col_c  col_d
0      4      3      2      1
1      4      3      2      1

回應評論

r表示它是一個原始字符串,特殊字符應該被解釋為原始字符。 這就是為什么在一個解決方案中我指出字符串是原始的並且只有兩個反斜杠。 在另一方面,我不得不用另一個反斜杠逃避每個反斜杠,留下四個反斜杠。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM