簡體   English   中英

如何讀取txt.file中沒有分隔符或固定寬度的數據框

[英]How to read a data frame in txt.file that doesn't have separator or fixed width with pandas

我正在處理文本文件的原始數據。 但是,它沒有分隔符或固定寬度。 每列都有不同的長度。 例如,列1的長度為12; 第2列的長度是5; 等等。 文件的定義是這樣的

我想知道在給定每列長度的情況下,某些軟件包中是否有一個功能可以處理這種文件。 我認為可行的一種方法是使用正則表達式迭代每一行和每一列。

這仍然是一個固定寬度的文件(這意味着每個字段的大小都是固定的,不必相等)。 所以,你可以使用pandas.read_fwf ,與widths參數作為[21,5,5,12...]閱讀本。 https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_fwf.html

假設沒有分隔符 ,最簡單的方法就是硬編碼字符串切片:

with open("text.txt", "r+") as fh:
  for row in fh:
    row.write(row[0:12]+","+row[12:17]+","+row[17:23]... ) #finish

然后,您可以在創建數據框時指定分隔符。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM