簡體   English   中英

如何從文本文件中解析Pandas列?

[英]How to parse Pandas columns from a text file?

我有一個文本文件,我想分隔每一列。 但是整個文本被大熊貓視為一欄:

   6/1/2018 12:01:11.490 AM HEP.U02.OIL.GOV.P2_RUN  <Unit #2>No.2 oil pump 
   runing   On      
   6/1/2018 12:01:19.383 AM HEP.COM.WAT.DRN.P1_CRTL Control No.1 drainage 
   pump On      
   6/1/2018 12:01:19.384 AM HEP.COM.WAT.DRN.P1_RUN  No.1 drainage pump run   
   On       
   6/1/2018 12:01:24.250 AM HEP.U02.OIL.GOV.LV_TL   <Unit #2>Oil level of 
   sump too low Off     
   6/1/2018 12:01:24.859 AM HEP.U02.OIL.GOV.P2_RUN  <Unit #2>No.2 oil pump 
   runing   Off     
   6/1/2018 12:02:07.564 AM HEP.U02.OIL.GOV.LV_TL   <Unit #2>Oil level of 
   sump too low On

我的數據看起來如何:

import re
import pandas as pd
p=[] 
df=pd.read_csv('./mine.txt',encoding='ISO-8859-1', sep='delimeter', 
engine='python' ,nrows=100)
print(df.shape)
df=df.columns.str.split('\t')
print(list(df))
print(df.shape)

df.shape()返回(100,1)之前和(1,)之后str.split()

我該如何分隔這些列?

您在選項卡上分隔數據,而不是空格。 如果您的文件是.tsv(制表符分隔值),那將是有意義的。 你應該用“\\ t”分隔它,但如果沒有,你應該使用“\\ s”來分隔空格而不是制表符。 這就是為什么你只能在str.split(“\\ t”)之后得到(1,)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM