簡體   English   中英

Python讀取逗號分隔的txt文件,具有數千個分隔符

[英]Python read comma separated txt file having thousands separator

我用逗號分隔的txt文件包含以下格式的數據(當然,還有更多的列和行)。

1977,PA,2017-08-07,55,New Firms,327.0
1978,NY,2017-08-07,45,New Firms,$30,127
1978,NY,2017-08-07,$10,000,New Firms,1,000

如您所見,有些數據包含數千個分隔符,我這樣讀:

df=pd.read_csv("data.txt", thousands=r',')
df.head()

這給出了錯誤信息

ParserError: Error tokenizing data. C error: Expected 13 fields in line 102996, saw 14

我認為發生錯誤是因為某些數據包含數千個分隔符。

有什么建議么?

試試這個

df=pd.read_csv("text.csv", sep=', ',header =None,names=['colA','colB','colC','colD','colE','colF'])

df.head()

它輸出:

Out[25]: 
   colA colB        colC     colD       colE     colF
0  1977   PA  2017-08-07       55  New Firms    327.0
1  1978   NY  2017-08-07       45  New Firms  $30,127
2  1978   NY  2017-08-07  $10,000  New Firms    1,000

也許還有一個額外的sep參數:

df = pd.read_csv("data.txt", sep = ', ', header = None, thousands = ',')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM