如何從文本文件中解析Pandas列？

Question

我有一個文本文件，我想分隔每一列。 但是整個文本被大熊貓視為一欄：

   6/1/2018 12:01:11.490 AM HEP.U02.OIL.GOV.P2_RUN  <Unit #2>No.2 oil pump 
   runing   On      
   6/1/2018 12:01:19.383 AM HEP.COM.WAT.DRN.P1_CRTL Control No.1 drainage 
   pump On      
   6/1/2018 12:01:19.384 AM HEP.COM.WAT.DRN.P1_RUN  No.1 drainage pump run   
   On       
   6/1/2018 12:01:24.250 AM HEP.U02.OIL.GOV.LV_TL   <Unit #2>Oil level of 
   sump too low Off     
   6/1/2018 12:01:24.859 AM HEP.U02.OIL.GOV.P2_RUN  <Unit #2>No.2 oil pump 
   runing   Off     
   6/1/2018 12:02:07.564 AM HEP.U02.OIL.GOV.LV_TL   <Unit #2>Oil level of 
   sump too low On

我的數據看起來如何：

import re
import pandas as pd
p=[] 
df=pd.read_csv('./mine.txt',encoding='ISO-8859-1', sep='delimeter', 
engine='python' ,nrows=100)
print(df.shape)
df=df.columns.str.split('\t')
print(list(df))
print(df.shape)

df.shape()返回(100,1)之前和(1,)之后str.split()

我該如何分隔這些列？

Answer 1

您在選項卡上分隔數據，而不是空格。 如果您的文件是.tsv（制表符分隔值），那將是有意義的。 你應該用“\\ t”分隔它，但如果沒有，你應該使用“\\ s”來分隔空格而不是制表符。 這就是為什么你只能在str.split（“\\ t”）之后得到（1，）。

如何從文本文件中解析Pandas列？

問題描述

1 個解決方案

解決方案1
0 2019-03-23 19:08:10

如何從文本文件中解析Pandas列？

問題描述

1 個解決方案

解決方案1 0 2019-03-23 19:08:10

解決方案1
0 2019-03-23 19:08:10