从CSV文件中选择数据框列名称

Question

我有一个.csv可以读取到DataFrame中，列的名称位于previos行中的同一.csv文件中。 通常，我删除所有“不必要的”行以创建DataFrame，然后对每个数据框的名称进行硬编码

Trigger time,2017-07-31,10:45:38
CH,Signal name,Input,Range,Filter,Span
CH1, "Tin_MIX_Air",TEMP,PT,Off,2000.000000,-200.000000,degC
CH2, "Tout_Fan2b",TEMP,PT,Off,2000.000000,-200.000000,degC
CH3, "Tout_Fan2a",TEMP,PT,Off,2000.000000,-200.000000,degC
CH4, "Tout_Fan1a",TEMP,PT,Off,2000.000000,-200.000000,degC

在这里，您可以看到列名称用双引号“ TinMix”，“ Tout ..”等组成的行，正好有16行带有名称

Logic/Pulse,Off
Data
Number,Date&Time,ms,CH1,CH2,CH3,CH4,CH5,CH7,CH8,CH9,CH10,CH11,CH12,CH13,CH14,CH15,CH16,CH20,Alarm1-10,Alarm11-20,AlarmOut
NO.,Time,ms,degC,degC,degC,degC,degC,degC,%RH,%RH,degC,degC,degC,degC,degC,Pa,Pa,A,A1234567890,A1234567890,A1234
1,2017-07-31 10:45:38,000,+25.6,+26.2,+26.1,+26.0,+26.3,+25.7,+43.70,+37.22,+25.6,+25.3,+25.1,+25.3,+25.3,+0.25,+0.15,+0.00,LLLLLLLLLL,LLLLLLLLLL,LLLL

在这里，每个变量的值开始。

我需要做的是从此.csv创建一个数据框，并将这些名称放在列名称中。 我是Python的新手，我不太确定该怎么做

import pandas as pd
path = r'path-to-file.csv'
data=pd.DataFrame()
with open(path, 'r') as f:
    for line in f:
        data = pd.concat([data, pd.DataFrame([tuple(line.strip().split(','))])], ignore_index=True)
data.drop(data.index[range(0,29)],inplace=True)
x=len(data.iloc[0])
data.drop(data.columns[[0,1,2,x-1,x-2,x-3]],axis=1,inplace=True)
data.reset_index(drop=True,inplace=True)
data = data.T.reset_index(drop=True).T
data = data.apply(pd.to_numeric)

到目前为止，这是我为获得具有有用数据的数据框所做的工作，我删除了所有对我无用的其他列，仅保留值。 最后三行用于重置行/列索引，并将整个df转换为浮点数。 我想要的是用我在第一段编码中显示的每个名称来命名列，就像我在手动执行此操作之前所说的那样：

data.columns = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p']

但我想从.csv文件中获取它们，因为可以更改CH＃-“名称”组合

非常感谢你的帮助！

Answer 1

评论：它是否可以在我拥有的另一个“ OPEN”循环中工作？

假设第2行至第6行的列名，第7行至EOF的数据名。
例如（未经测试的代码）

data = None
columns = []

with open (path) as fh:
   for row, line in enumerate (fh, 1):
       if row > 2 and row <= 6:
            ch, name = line.split(',')[:2]
            columns.append(name)
        else:
            row_data = [tuple(line.strip().split(','))]
            if not data:
                data = pd.DataFrame(row_data, columns=columns, ignore_index=True)
            else:
                data.append(row_data)

问题：...我想从.csv文件中获取它们

从...开始：

with open (path) as fh:
   for row, line in enumerate (fh, 1):
       if row > 2:
            ch, name = line.split(',')[:2]

从CSV文件中选择数据框列名称

问题描述

1 个解决方案

解决方案1
0 已采纳 2017-08-18 08:05:12

从CSV文件中选择数据框列名称

问题描述

1 个解决方案

解决方案1 0 已采纳 2017-08-18 08:05:12

解决方案1
0 已采纳 2017-08-18 08:05:12