Pandas：將列條目合並為一行

Question

我有以下數據集，其中“交易詳細信息”列存儲每個條目的所有值，但在不同的行中，何時應該將每個條目存儲在同一行中。 有什么辦法可以做到這一點，以便如果調用“交易詳細信息”的第一個值，則會打印出所有相關行，而不僅僅是第一行？

也許

Answer 1

使用df您的數據框，您可以執行以下操作：

import numpy as np
import pandas as pd

df_new = df[~df.Date.isna()].reset_index(drop=True)
df_new["Transaction Details"] = (
    df["Transaction Details"]
        .groupby(np.where(df.Date.isna(), 0, 1).cumsum())
        .apply(lambda col: ", ".join(str(item) for item in col))
        .reset_index(drop=True)
)

就像一個說明：結果 - df_new - 對於以下數據幀

df = pd.DataFrame(
    {
        "Date": [1, np.NaN, np.NaN, 2, np.NaN, np.NaN, np.NaN],
        "Transaction Details": ["a", "b", "c", "d", "e", "f", "g"]
    }
)

   Date Transaction Details
0   1.0                   a
1   NaN                   b
2   NaN                   c
3   2.0                   d
4   NaN                   e
5   NaN                   f
6   NaN                   g

是

   Date Transaction Details
0   1.0             a, b, c
1   2.0          d, e, f, g

如果df["Transaction Details"]只包含字符串，那么你可以替換

        .apply(lambda col: ", ".join(str(item) for item in col))

與.apply(", ".join) 。

Answer 2

配置

讓我們先創建一些示例數據。

df = pd.DataFrame({
    "Date": ["01-Apr", np.nan, np.nan, "02-Apr", np.nan],
    "Details": ["Payment", "Supplier Payment", "1000", "Payment", "SGD 1658.5"]
})

     Date           Details
0  01-Apr           Payment
1     NaN  Supplier Payment
2     NaN              1000
3  02-Apr           Payment
4     NaN        SGD 1658.5

無分隔符合並

如果你想合並行之間沒有任何分隔符，你可以試試這個。

df["Date"] = df["Date"].ffill()
df = df.fillna("").groupby("Date", as_index=False).sum()

輸出

這產生以下結果。

     Date                      Details
0  01-Apr  PaymentSupplier Payment1000
1  02-Apr            PaymentSGD 1658.5

與分隔符合並

如果您想在合並的值之間有一些分隔符，事情會變得更加復雜。

sep = ", "
df["Date"] = df["Date"].ffill()
df["Details"] += sep
df = df.fillna("").groupby("Date", as_index=False).sum()
df["Details"] = df["Details"].str[:-1 * len(sep)]

輸出

這給出了以下結果。

     Date                          Details
0  01-Apr  Payment, Supplier Payment, 1000
1  02-Apr              Payment, SGD 1658.5

Pandas：將列條目合並為一行

問題描述

2 個解決方案

解決方案1
0 2021-10-29 11:41:18

解決方案2
0 2021-10-29 11:54:52

配置

無分隔符合並

輸出

與分隔符合並

輸出

Pandas：將列條目合並為一行

問題描述

2 個解決方案

解決方案1 0 2021-10-29 11:41:18

解決方案2 0 2021-10-29 11:54:52

配置

無分隔符合並

輸出

與分隔符合並

輸出

解決方案1
0 2021-10-29 11:41:18

解決方案2
0 2021-10-29 11:54:52