[英]How to parse Pandas columns from a text file?
我有一個文本文件,我想分隔每一列。 但是整個文本被大熊貓視為一欄:
6/1/2018 12:01:11.490 AM HEP.U02.OIL.GOV.P2_RUN <Unit #2>No.2 oil pump
runing On
6/1/2018 12:01:19.383 AM HEP.COM.WAT.DRN.P1_CRTL Control No.1 drainage
pump On
6/1/2018 12:01:19.384 AM HEP.COM.WAT.DRN.P1_RUN No.1 drainage pump run
On
6/1/2018 12:01:24.250 AM HEP.U02.OIL.GOV.LV_TL <Unit #2>Oil level of
sump too low Off
6/1/2018 12:01:24.859 AM HEP.U02.OIL.GOV.P2_RUN <Unit #2>No.2 oil pump
runing Off
6/1/2018 12:02:07.564 AM HEP.U02.OIL.GOV.LV_TL <Unit #2>Oil level of
sump too low On
我的數據看起來如何:
import re
import pandas as pd
p=[]
df=pd.read_csv('./mine.txt',encoding='ISO-8859-1', sep='delimeter',
engine='python' ,nrows=100)
print(df.shape)
df=df.columns.str.split('\t')
print(list(df))
print(df.shape)
df.shape()
返回(100,1)
之前和(1,)
之后str.split()
我該如何分隔這些列?
您在選項卡上分隔數據,而不是空格。 如果您的文件是.tsv(制表符分隔值),那將是有意義的。 你應該用“\\ t”分隔它,但如果沒有,你應該使用“\\ s”來分隔空格而不是制表符。 這就是為什么你只能在str.split(“\\ t”)之后得到(1,)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.