簡體   English   中英

如何在 pandas 中讀取帶有多個定界符的 csv 文件

[英]How to read a csv file with muplitiple delimiter in pandas

我有一個帶有分隔符(點和下划線)的 csv 文件,我正在使用 sep='_.' 在 read_csv 中,但它在閱讀時沒有將點作為 sep。

輸入 jks_12034.45_89.12

output jks 12034 45 89 12

文檔中所述

超過 1 個字符且不同於 '\s+' 的分隔符將被解釋為正則表達式

如果你使用sep="_\." 它只會匹配同時具有下划線點的點。

如果你想在 unserscore點上拆分,請使用sep="\.|_"sep="[_\.]"

使用engine='python'sep=r'[_.]'作為pd.read_csv的參數:

df = pd.read_csv('data.csv', sep=r'[_.]', engine='python', header=None)
print(df)

# Output
     0      1   2   3   4
0  jks  12034  45  89  12

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM