仅使用标准库，按另一列的分组值中的一列的累积总数对文本文件进行排序？

Question

我有一个这样的行文件

id, car_type, cost
1, benz, 60000
2, benz, 55000
3, bmw, 30000
4, benz, 25000
5, bmw, 26000
6, ford, 5000

我想按每个car_type总成本对该文件进行排序。 例如，“ benz ”的总费用为60000 + 55000 + 25000 = 14000

所以最终的输出应该是

benz, 140000
bmw, 56000
ford, 5000

到目前为止，这就是我所拥有的：

file = "small_sample.txt"


f=open(file,"r")
lines=f.readlines()[1:]
car_and_cost ={}
for x in lines:
    cost = x.split(',')[4].rstrip('\n')
    car_and_cost.update({x.split(',')[3]:float(cost)})
f.close()
print(car_and_cost)

new_dic = {}
for key,lis in car_and_cost.items():
    new_dic[key] = sum(lis)
print(new_dic)

我几乎被困住了。 首先，我据此生成的字典的总和不正确，而且我根本不知道如何按值对字典进行排序

Answer 1

这是使用csv和collections模块的一种方法

例如：

import csv
from collections import defaultdict, OrderedDict

result = defaultdict(int)

with open(filename) as infile:
    reader = csv.DictReader(infile)
    for row in reader:                    #Iterate Each row
        result[row[" car_type"]] += int(row[" cost"])   #Add costs

print(OrderedDict(sorted(result.items(), key=lambda x: x[1], reverse=True)))

输出：

OrderedDict([(' benz', 140000), (' bmw', 56000), (' ford', 5000)])

Answer 2

使用熊猫：

import pandas as pd
df = pd.read_csv(logFile)

result = df.groupby(' car_type').sum()
print(result)

输出：

           id    cost
 car_type            
 benz       7  140000
 bmw        8   56000
 ford       6    5000

编辑：

logFile = "tem.csv"
array = []
import csv

with open("tem.csv", "r+") as fin:
    for row in csv.reader(fin):
        array.append(row[1:])

dd = {k: 0 for k in dict(array).keys()}
for x in array: dd[x[0]] += int(x[1])
print(dd)

输出：

{' benz': 140000, ' bmw': 56000, ' ford': 5000}

或者，如果您希望它们在列表中：

print([[k,v] for k,v in  dd.items()])

输出：

[[' benz', 140000], [' bmw', 56000], [' ford', 5000]]

仅使用标准库，按另一列的分组值中的一列的累积总数对文本文件进行排序？

问题描述

2 个解决方案

解决方案1
3 已采纳 2019-02-06 06:51:46

解决方案2
1 2019-02-06 07:09:49

仅使用标准库，按另一列的分组值中的一列的累积总数对文本文件进行排序？

问题描述

2 个解决方案

解决方案1 3 已采纳 2019-02-06 06:51:46

解决方案2 1 2019-02-06 07:09:49

解决方案1
3 已采纳 2019-02-06 06:51:46

解决方案2
1 2019-02-06 07:09:49