繁体 English 中英

Pandas DataFrame 沿新轴连接

[英]Pandas DataFrame concatenate along new axis

原文 2020-05-28 13:52:49 4 2 python/ pandas/ dataframe

我有一个包含 1000+ csv 文件的目录，我想读取这些文件并将其存储在 dataframe 中，然后将其保存到文件中。 我希望 dataframe 尺寸为 [文件，文件中的行，行的内容]。 到目前为止，这是我想出的：

import pandas as pd
import glob

csv_files = glob.glob("data/*sample.csv")
df = (pd.read_csv(f) for f in csv_files)
dataset = pd.concat(df, ignore_index=True)

这给了我一个 dataframe 形状 [line, content of line] 但我无法再看到该行来自哪个文件。 有人可以在这里帮助我吗？

2 个解决方案

您可以在 list 中创建具有我们扩展名的所有文件名的列表，然后将其传递给concat中的参数keys ，因此创建了MultiIndex 。 最后删除第二级并将其转换为索引：

from os.path import splitext, basename

csv_files = glob.glob("data/*sample.csv")
names = (splitext(basename(x))[0] for x in csv_files)
dfs = (pd.read_csv(f) for f in csv_files)

df = (pd.concat(dfs, keys=names)
        .reset_index(level=1, drop=True)
        .rename_axis('New')
        .reset_index())

jezrael 的解决方案有点啰嗦，但这是我多年来一直使用的。 可能是时候让它更简洁了。

os.chdir('C:/')
file_list = []
for file in os.listdir():
    df = pd.read_csv(file)
    df['Filename'] = file
    file_list.append(df)
    df = pd.concat(file_list, ignore_index=True)

沿 pandas dataframe 中的列连接数据帧

[英]Concatenate dataframes along columns in a pandas dataframe

沿 Pandas 中 DataFrame 行轴的布尔索引

[英]Boolean Indexing along the row axis of a DataFrame in pandas

沿轴 = 1 (Pandas) 将系列连接到 DataFrame 的问题

[英]Problem with concatenating a series to a DataFrame along axis=1 (Pandas)

在新轴上连接两个 pandas 数据帧

[英]Concatenate two pandas dataframes on a new axis

将数据行连接到Pandas中的新数据框

[英]Concatenate rows of data to new dataframe in Pandas

当轴 = 0 时，将两列连接/合并为 Pandas dataframe 一列

[英]Concatenate/combine two columns into one for Pandas dataframe when axis = 0

Pandas DataFrame groupby 沿分组轴应用和重新扩展

[英]Pandas DataFrame groupby apply and re-expand along grouped axis

使用一系列新数据在major_axis上种植一个pandas面板？

[英]Grow a pandas panel along major_axis with a stream of new data?

如何将行元素对连接到 pandas dataframe 中的新列中？

[英]How to concatenate pairs of row elements into a new column in a pandas dataframe?

连接 Pandas DataFrame 中的行

[英]concatenate rows in Pandas DataFrame

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 沿 pandas dataframe 中的列连接数据帧沿 Pandas 中 DataFrame 行轴的布尔索引沿轴 = 1 (Pandas) 将系列连接到 DataFrame 的问题在新轴上连接两个 pandas 数据帧将数据行连接到Pandas中的新数据框当轴 = 0 时，将两列连接/合并为 Pandas dataframe 一列 Pandas DataFrame groupby 沿分组轴应用和重新扩展使用一系列新数据在major_axis上种植一个pandas面板？如何将行元素对连接到 pandas dataframe 中的新列中？连接 Pandas DataFrame 中的行

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM