[英]Read data seperated with tab from file in python
如果我有以下文件:
Pig
06-13-01 56.2
06-13-02 59.2
06-13-03 54.3
.
.
.
Cow
06-13-01 201.2
06-13-02 204.1
06-13-03 205.6
.
.
.
并希望创建一个 object 的实例,其中包含动物的数据以及相关的日期和重量(由制表符分隔的值)。 我如何在我的主程序中做到这一点?
我从这个开始:
with open(filnamn, encoding="utf-8") as file:
dateAndWeight = []
lines = fil.readlines()
lines = [line.rstrip() for line in lines]
stepsBetweenName = 68
numberOfAnimals = int(len(lines)/stepsBetweenName)`
但这仅仅是开始。 有人有建议吗?
您的数据在动物名称和制表符分隔的数据之间交替。 这非常适合itertools.groupby
根据列数等条件创建自己的迭代器。
在此示例中,只要行数在 1 和非 1 之间变化, groupby
就会开始新的子迭代。 当它为 1 时,你知道你有一个新动物。 非 1 时,您有数据行。 在这里,我刚刚建立了一个字典,将动物名称映射到它的日期/重量信息。
import itertools
import io
import csv
# test file
file = io.StringIO("""Pig
06-13-01\t56.2
06-13-02\t59.2
06-13-03\t54.3
Cow
06-13-01\t201.2
06-13-02\t204.1
06-13-03\t205.6""")
# will hold `animal:[[date, weight], ...]` associations
animal_map = {}
# data is TSV file
reader = csv.reader(file, delimiter="\t")
# Group by rows of length 1 which start a new set of animal date, weight pairs
for new_animal, rows in itertools.groupby(reader, lambda row: len(row) == 1):
if new_animal:
# get animal from first row
animal = next(rows)[0]
else:
# add animal and data to map
animal_map[animal] = list(rows)
del animal
print(animal_map)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.