Pandas：将列条目合并为一行

Question

我有以下数据集，其中“交易详细信息”列存储每个条目的所有值，但在不同的行中，何时应该将每个条目存储在同一行中。 有什么办法可以做到这一点，以便如果调用“交易详细信息”的第一个值，则会打印出所有相关行，而不仅仅是第一行？

也许

Answer 1

使用df您的数据框，您可以执行以下操作：

import numpy as np
import pandas as pd

df_new = df[~df.Date.isna()].reset_index(drop=True)
df_new["Transaction Details"] = (
    df["Transaction Details"]
        .groupby(np.where(df.Date.isna(), 0, 1).cumsum())
        .apply(lambda col: ", ".join(str(item) for item in col))
        .reset_index(drop=True)
)

就像一个说明：结果 - df_new - 对于以下数据帧

df = pd.DataFrame(
    {
        "Date": [1, np.NaN, np.NaN, 2, np.NaN, np.NaN, np.NaN],
        "Transaction Details": ["a", "b", "c", "d", "e", "f", "g"]
    }
)

   Date Transaction Details
0   1.0                   a
1   NaN                   b
2   NaN                   c
3   2.0                   d
4   NaN                   e
5   NaN                   f
6   NaN                   g

是

   Date Transaction Details
0   1.0             a, b, c
1   2.0          d, e, f, g

如果df["Transaction Details"]只包含字符串，那么你可以替换

        .apply(lambda col: ", ".join(str(item) for item in col))

与.apply(", ".join) 。

Answer 2

配置

让我们先创建一些示例数据。

df = pd.DataFrame({
    "Date": ["01-Apr", np.nan, np.nan, "02-Apr", np.nan],
    "Details": ["Payment", "Supplier Payment", "1000", "Payment", "SGD 1658.5"]
})

     Date           Details
0  01-Apr           Payment
1     NaN  Supplier Payment
2     NaN              1000
3  02-Apr           Payment
4     NaN        SGD 1658.5

无分隔符合并

如果你想合并行之间没有任何分隔符，你可以试试这个。

df["Date"] = df["Date"].ffill()
df = df.fillna("").groupby("Date", as_index=False).sum()

输出

这产生以下结果。

     Date                      Details
0  01-Apr  PaymentSupplier Payment1000
1  02-Apr            PaymentSGD 1658.5

与分隔符合并

如果您想在合并的值之间有一些分隔符，事情会变得更加复杂。

sep = ", "
df["Date"] = df["Date"].ffill()
df["Details"] += sep
df = df.fillna("").groupby("Date", as_index=False).sum()
df["Details"] = df["Details"].str[:-1 * len(sep)]

输出

这给出了以下结果。

     Date                          Details
0  01-Apr  Payment, Supplier Payment, 1000
1  02-Apr              Payment, SGD 1658.5

Pandas：将列条目合并为一行

问题描述

2 个解决方案

解决方案1
0 2021-10-29 11:41:18

解决方案2
0 2021-10-29 11:54:52

配置

无分隔符合并

输出

与分隔符合并

输出

Pandas：将列条目合并为一行

问题描述

2 个解决方案

解决方案1 0 2021-10-29 11:41:18

解决方案2 0 2021-10-29 11:54:52

配置

无分隔符合并

输出

与分隔符合并

输出

解决方案1
0 2021-10-29 11:41:18

解决方案2
0 2021-10-29 11:54:52