如何删除 CSV 文件中的列？

Question

我已经能够使用该站点上多个用户的输入创建一个 csv 和 python，我希望对您的帖子表示感谢。 我现在很困惑，将发布我的第一个问题。

我的 input.csv 看起来像这样：

day,month,year,lat,long
01,04,2001,45.00,120.00
02,04,2003,44.00,118.00

我正在尝试删除“年”列及其所有条目。 总共有 40 多个条目，年份范围从 1960 年到 2010 年。

Answer 1

import csv
with open("source","rb") as source:
    rdr= csv.reader( source )
    with open("result","wb") as result:
        wtr= csv.writer( result )
        for r in rdr:
            wtr.writerow( (r[0], r[1], r[3], r[4]) )

顺便说一句，可以删除for循环，但并没有真正简化。

        in_iter= ( (r[0], r[1], r[3], r[4]) for r in rdr )
        wtr.writerows( in_iter )

此外，您可以以超字面意思的方式满足删除列的要求。 我发现这通常是一个糟糕的政策，因为它不适用于删除多个列。 当您尝试删除第二个时，您发现所有位置都发生了变化，结果行并不明显。 但仅对于一列，这是有效的。

            del r[2]
            wtr.writerow( r )

Answer 2

使用 Pandas 模块会容易得多。

import pandas as pd
f=pd.read_csv("test.csv")
keep_col = ['day','month','lat','long']
new_f = f[keep_col]
new_f.to_csv("newFile.csv", index=False)

这是简短的解释：

>>>f=pd.read_csv("test.csv")
>>> f
   day  month  year  lat  long
0    1      4  2001   45   120
1    2      4  2003   44   118
>>> keep_col = ['day','month','lat','long'] 
>>> f[keep_col]
    day  month  lat  long
0    1      4   45   120
1    2      4   44   118
>>>

Answer 3

使用 dict 来抓取标题，然后循环获取您需要的内容。

import csv
ct = 0
cols_i_want = {'cost' : -1, 'date' : -1}
with open("file1.csv","rb") as source:
    rdr = csv.reader( source )
    with open("result","wb") as result:
        wtr = csv.writer( result )
        for row in rdr:
            if ct == 0:
              cc = 0
              for col in row:
                for ciw in cols_i_want: 
                  if col == ciw:
                    cols_i_want[ciw] = cc
                cc += 1
            wtr.writerow( (row[cols_i_want['cost']], row[cols_i_want['date']]) )
            ct += 1

Answer 4

您可以直接删除列

del variable_name['year']

Answer 5

我会使用带有 col 编号的 Pandas

f = pd.read_csv("test.csv", usecols=[0,1,3,4])

f.to_csv("test.csv", index=False)

Answer 6

我将为这个问题添加另一个答案。 由于 OP 没有说他们需要用 Python 来做，删除列的最快方法（特别是当输入文件有数十万行时）是使用awk 。

这是 awk 闪耀的问题类型：

$ awk -F, 'BEGIN {OFS=","} {print $1,$2,$4,$5}' input.csv

（如果您需要将 output 保存到文件，请随意输入 append > output.csv到上面的命令）

100% 归功于@eric-wilson，他提供了这个很棒的答案，作为对原始问题的评论，10 年前，几乎没有任何功劳。

Answer 7

您可以使用csv包迭代您的 csv 文件并将您想要的列输出到另一个 csv 文件。

下面的示例未经测试，应说明解决方案：

import csv

file_name = 'C:\Temp\my_file.csv'
output_file = 'C:\Temp\new_file.csv'
csv_file = open(file_name, 'r')
## note that the index of the year column is excluded
column_indices = [0,1,3,4]
with open(output_file, 'w') as fh:
    reader = csv.reader(csv_file, delimiter=',')
    for row in reader:
       tmp_row = []
       for col_inx in column_indices:
           tmp_row.append(row[col_inx])
       fh.write(','.join(tmp_row))

Answer 8

在我的脑海里，这将在没有任何错误检查或配置任何东西的情况下完成。 那就是“留给读者”。

outFile = open( 'newFile', 'w' )
for line in open( 'oldFile' ):
   items = line.split( ',' )
   outFile.write( ','.join( items[:2] + items[ 3: ] ) )
outFile.close()

Answer 9

尝试：

result= data.drop('year', 1)
result.head(5)

Answer 10

尝试 python 和 pandas 并排除该列，您不想拥有：

import pandas as pd

# the ',' is the default separator, but if your file has another one, you have to define it with sep= parameter
df = pd.read_csv("input.csv", sep=',')
exclude_column = "year"
new_df = df.loc[:, df.columns != exclude_column]
# you can even save the result to the same file
new_df.to_csv("input.csv", index=False, sep=',')

Answer 11

这取决于您如何存储解析后的 CSV，但通常您需要 del 运算符。

如果你有一个字典数组：

input = [ {'day':01, 'month':04, 'year':2001, ...}, ... ]
for E in input: del E['year']

如果你有一个数组数组：

input = [ [01, 04, 2001, ...],
          [...],
          ...
        ]
for E in input: del E[2]

如何删除 CSV 文件中的列？

问题描述

11 个解决方案

解决方案1
58 已采纳 2011-09-28 21:08:34

解决方案2
45 2015-12-24 16:49:20

解决方案3
6 2012-11-16 05:50:43

解决方案4
2 2016-03-28 13:16:14

解决方案5
2 2020-04-21 16:03:53

解决方案6
2 2021-10-04 20:16:47

解决方案7
2 2011-09-28 20:06:21

解决方案8
2 2011-09-28 20:13:24

解决方案9
1 2019-04-30 01:02:43

解决方案10
0 2022-03-08 20:29:37

解决方案11
0 2011-09-28 20:10:37

如何删除 CSV 文件中的列？

问题描述

11 个解决方案

解决方案1 58 已采纳 2011-09-28 21:08:34

解决方案2 45 2015-12-24 16:49:20

解决方案3 6 2012-11-16 05:50:43

解决方案4 2 2016-03-28 13:16:14

解决方案5 2 2020-04-21 16:03:53

解决方案6 2 2021-10-04 20:16:47

解决方案7 2 2011-09-28 20:06:21

解决方案8 2 2011-09-28 20:13:24

解决方案9 1 2019-04-30 01:02:43

解决方案10 0 2022-03-08 20:29:37

解决方案11 0 2011-09-28 20:10:37

解决方案1
58 已采纳 2011-09-28 21:08:34

解决方案2
45 2015-12-24 16:49:20

解决方案3
6 2012-11-16 05:50:43

解决方案4
2 2016-03-28 13:16:14

解决方案5
2 2020-04-21 16:03:53

解决方案6
2 2021-10-04 20:16:47

解决方案7
2 2011-09-28 20:06:21

解决方案8
2 2011-09-28 20:13:24

解决方案9
1 2019-04-30 01:02:43

解决方案10
0 2022-03-08 20:29:37

解决方案11
0 2011-09-28 20:10:37