Pandas 創建新列，其中來自另一列的所有條目對應於唯一值

Question

如果問題不夠清楚，我很抱歉。 假設我有這個 dataframe：

timestamp source dest size

1          a      b     5
1          c      d     6
2          c      e     7
2          d      a     8

從這個 dataframe 我想要這樣的東西：

timestamp      link        size
 1             a b c d     5 6
 2             c e d a     7 8

我怎樣才能做到這一點？

謝謝

Answer 1

這是一個帶有幾個附加步驟的 pivot，因為您希望 pivot 在兩列上彼此獨立。

u = df.melt('timestamp')
m = u['variable'].isin(['source', 'dest'])

u.loc[m, 'variable'] = 'link'

u.pivot_table(
  'value', 'timestamp', 'variable', aggfunc=list)

variable           link    size
timestamp
1          [a, c, b, d]  [5, 6]
2          [c, d, e, a]  [7, 8]

首先使用rename的替代方法

d = dict(source='link', dest='link')

df.rename(columns=d).melt('timestamp').pivot_table(
  'value', 'timestamp', 'variable', aggfunc=list)

variable           link    size
timestamp
1          [a, c, b, d]  [5, 6]
2          [c, d, e, a]  [7, 8]

Answer 2

您也可以使用 pandas dataframe 的groupby方法。 確保您的size列包含字符串。

df['link'] = df['source'] + ' ' + df['dest']
df = df.drop(['source', 'dest'], axis = 1)
newDf = df.groupby('timestamp').agg(lambda col: ' '.join(col))

Pandas 創建新列，其中來自另一列的所有條目對應於唯一值

問題描述

2 個解決方案

解決方案1
2 2019-10-24 14:27:48

解決方案2
1 已采納 2019-10-24 14:49:50

Pandas 創建新列，其中來自另一列的所有條目對應於唯一值

問題描述

2 個解決方案

解決方案1 2 2019-10-24 14:27:48

解決方案2 1 已采納 2019-10-24 14:49:50

解決方案1
2 2019-10-24 14:27:48

解決方案2
1 已采納 2019-10-24 14:49:50