如何在 Python 中解析混合 CSV 文件？

Question

我正在处理一个类似于这个的 CSV 文件

foo; val1; position1
bar; name1; address1; phone_nbr1
bar; name2; address2; phone_nbr2
foo; val2; position2
bar; name3; address3; phone_nbr3
bar; name4; address4; phone_nbr4
bar; name5; address5; phone_nbr5
bar; name6; address6; phone_nbr6
foo; val3; position3

不用说，我无法修改 CSV。

以foo行显示的实例与带有bar线的实例不同（注意它们甚至没有相同数量的字段）

我只需要读取这些数据，无需编写。

我的第一个想法是将文件分成两个临时文件，然后使用csv.DictReader分别读取每个文件，但是我真的不喜欢这种方法。

有没有更简单的方法来做到这一点？ 如果可能的话，我想避免将文件写入磁盘。

作为记录，我在 Solaris 10 机器上使用 Python2.7。

Answer 1

您可以从csv.reader收集两个不同列表中的记录，具体取决于它们的长度（或用于区分两个流的任何标准）：

list1 = []
list2 = []
with open("input.csv", "rb") as f:
    for record in csv.reader(f, delimiter=";"):
        if len(record) == 3:
            list1.append(record)
        else:
            list2.append(record)

Answer 2

csv.reader()对此没有问题：

import csv
foo = []
bar = []
with open("test.csv", 'r') as f:
    c = csv.reader(f, delimiter = ";")
    for row in c:
        if row[0] == "foo":
            foo.append(row[1:])
        elif row[0] == "bar":
            bar.append(row[1:])
print(foo)
print(bar)

结果是

[[' val1', ' position1'], [' val2', ' position2'], [' val3', ' position3']]
[[' name1', ' address1', ' phone_nbr1'], [' name2', ' address2', ' phone_nbr2'], [' name3', ' address3', ' phone_nbr3'], [' name4', ' address4', ' phone_nbr4'], [' name5', ' address5', ' phone_nbr5'], [' name6', ' address6', ' phone_nbr6']]

Answer 3

只在每一行使用str.split怎么样？

items = line.split(";")

然后，如果items列表中的第一项是foo你做一件事，如果它是bar你做别的事。

Answer 4

行不同的事实对于csv模块不是问题，但您必须根据第一个“单元格”以不同方式分析行内容。

代码示例：

with open(input_file, 'rb') as fin:
    c = csv.reader(fin)
    for line in c:
         if line[0] == 'foo':
              # do some treatment
         elif line[0] == 'bar':
              # do something else
    c.close()

Answer 5

从您的问题中不清楚您真正想要实现的目标是什么，但我不确定您是否需要这里的 csv 模块。

for row in myfile.readlines():
    cols = [r.strip() for r in row.split(';')]
    if (cols[0] == "foo"):
        # Do something for foo
    elif (cols[0] == "bar"):
        # Do something for bar

Answer 6

怎么样：

foos = []
bars = []
for line in csv.reader(open("file.csv","rb"), delimiter=";"):
  if line[0] == "foo":
    foos.append(Foo(line[1], line[2]))
  else:
    bars.append(Bar(line[1], line[2], line[3]))

假设您有一个Foo和一个Bar类，将其余的行单元格作为参数。

如何在 Python 中解析混合 CSV 文件？

问题描述

6 个解决方案

解决方案1
6 已采纳 2011-10-26 12:47:43

解决方案2
4 2011-10-26 12:48:09

解决方案3
1 2011-10-26 12:44:05

解决方案4
0 2011-10-26 12:49:05

解决方案5
0 2011-10-26 12:50:03

解决方案6
0 2011-10-26 12:50:15

如何在 Python 中解析混合 CSV 文件？

问题描述

6 个解决方案

解决方案1 6 已采纳 2011-10-26 12:47:43

解决方案2 4 2011-10-26 12:48:09

解决方案3 1 2011-10-26 12:44:05

解决方案4 0 2011-10-26 12:49:05

解决方案5 0 2011-10-26 12:50:03

解决方案6 0 2011-10-26 12:50:15

解决方案1
6 已采纳 2011-10-26 12:47:43

解决方案2
4 2011-10-26 12:48:09

解决方案3
1 2011-10-26 12:44:05

解决方案4
0 2011-10-26 12:49:05

解决方案5
0 2011-10-26 12:50:03

解决方案6
0 2011-10-26 12:50:15