使用 csv.reader 将文件读入列表但跳过特定列（Python）

Question

您好，并在此先感谢您的帮助。 我是 Python 新手，我找到并尝试了很多解决方案，但似乎无法获得正确的输出。

我有一个包含几列的 csv 文件。 我想跳过字段名称/第一行，然后将文件读入列表。 我还想跳过一列，结果如下：第 1 列、第 2 列、第 3 列、第 5 列...我想这样做是因为我正在合并另外两个 csv 文件（已转换为列表）并且它们具有不同的结构.

这是我发现 csv 文件具有不同结构之前的原始代码...

#convert input file1 to list
reader = csv.reader(file1,delimiter=',')
next(reader)    
list_1 = []
list_1 = list(reader)

我试过了：

reader = csv.reader(file1,delimiter=',')
next(reader)
included_cols = [0, 1, 2, 3, 5, 6, 7]

for row in reader:
    content = list(row[i] for i in included_cols)

list_1 = list(content)

但是当我将三个列表合并到一个排序列表中时，这不会正确输出，如下所示：

unsortedList = list_1 + list_2 + list_3

然后我创建一个排序列表：

sortedList = sorted(unsortedList,key=operator.itemgetter(0))

并尝试像这样输出文件：

with open('output.csv','a') as result_file:
    wr = csv.writer(result_file, dialect='excel')
    wr.writerows(sortedList)

结果输出：顶部很奇怪

Answer 1

一般来说，我会改用熊猫。 假设您有一个名为test.csv的 CSV 文件：

a,b,c,d
1,2,3,4
5,6,7,8

我们可以使用pandas来读取它：

import itertools
import pandas as pd

df = pd.read_csv('test.csv', skiprows=[0], usecols=[0,1,3], header=None)
print(df)
   0  1  3
0  1  2  4
1  5  6  8

然后，您可以从行生成列表：

lists = df.values.tolist()

最后变成一个列表：

merged = list(itertools.chain(*lists))
print(merged)
[1, 2, 4, 5, 6, 8]

使用 csv.reader 将文件读入列表但跳过特定列（Python）

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-09-18 00:52:12

使用 csv.reader 将文件读入列表但跳过特定列（Python）

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-09-18 00:52:12

解决方案1
1 已采纳 2020-09-18 00:52:12