Pandas：将列名添加到多个 csv 文件的第三列

Question

我在同一目录中有多个 csv 文件。 每个 csv 文件包含 3 列，但在第 3 列中，缺少列名。 要读取所有 csv 个文件，我必须使用error_bad_lines=False 。 现在，我想将列名c3添加到多个 csv 文件的第三列。

样本 df：

v     info  
12    days    6
53    x       a
42    y       b

预计 output：

    v    info   c3
0  12    days    6
1  53    x       a
2  42    y       b

Answer 1

首先，将索引“v”转换为列

df = df.reset_index()

然后，您可以简单地更改列。

df.columns = ["v", "info", "c3"]

最后，

import pandas as pd
for file in os.listdir(directory):
    if file.endswith(".csv"):
        df = pd.read_csv(file)
        df = df.reset_index() # this is option line
        df.columns = ["v", "info", "c3"]
        df.to_csv(file)

Answer 2

不确定你的 csv 长什么样，所以我假设你的 csv 是：

v,info,
12,days,6
53,x,a
42,y,b

不管怎样，您可以将所有 csv 文件加载到一个目录中并更改列名，如下所示：

import pandas as pd
import glob

for f in glob.glob("C:\*.csv"):
    print(f)  # f is a file name
    df = pd.read_csv(f)
    df.reset_index() # add index column, 0, 1, 2, ...
    df.columns = ['v', 'info', 'c3'] # change column names
    df.to_csv(f)  # save it (overwriting)

您可以在此处详细了解如何使用glob加载目录中的文件： https://www.geeksforgeeks.org/how-to-use-glob-function-to-find-files-recursively-in-python/

Answer 3

利用：

a = pd.DataFrame({'v': [12,53,42], 'info':['days','x','y'], '':[6,'a','b']})
cols = list(a.columns)[:2]
cols.append('col3')
a.columns = cols
a

output：

或者，简单地说：

a.rename(columns={'':'new'})

Pandas：将列名添加到多个 csv 文件的第三列

问题描述

3 个解决方案

解决方案1
1 2022-03-08 04:48:03

解决方案2
1 已采纳 2022-03-08 05:00:21

解决方案3
0 2022-03-08 05:24:09

Pandas：将列名添加到多个 csv 文件的第三列

问题描述

3 个解决方案

解决方案1 1 2022-03-08 04:48:03

解决方案2 1 已采纳 2022-03-08 05:00:21

解决方案3 0 2022-03-08 05:24:09

解决方案1
1 2022-03-08 04:48:03

解决方案2
1 已采纳 2022-03-08 05:00:21

解决方案3
0 2022-03-08 05:24:09