從現有的列名在 Pandas DataFrame 中創建一個新列

Question

我想解構一個 Pandas DataFrame，使用列標題作為新的數據列，並創建一個包含行索引和列的所有組合的列表。 展示比解釋更容易：

index_col = ["store1", "store2", "store3"]
cols = ["January", "February", "March"]
values = [[2,3,4],[5,6,7],[8,9,10]]
df = pd.DataFrame(values, index=index_col, columns=cols)

從這個 DataFrame 我希望得到以下列表：

[['store1', 'January', 2],
 ['store1', 'February', 3],
 ['store1', 'March', 4],
 ['store2', 'January', 5],
 ['store2', 'February', 6],
 ['store2', 'March', 7],
 ['store3', 'January', 8],
 ['store3', 'February', 9],
 ['store3', 'March', 10]]

有沒有方便的方法來做到這一點？

Answer 1

df.unstack().swaplevel().reset_index().values.tolist()
#OR
df.reset_index().melt(id_vars="index").values.tolist()
# [['store1', 'January', 2],
#  ['store2', 'January', 5],
#  ['store3', 'January', 8],
#  ['store1', 'February', 3],
#  ['store2', 'February', 6],
#  ['store3', 'February', 9],
#  ['store1', 'March', 4],
#  ['store2', 'March', 7],
#  ['store3', 'March', 10]]

通過以下，元素的順序將與問題中的輸出相匹配。

df.transpose().unstack().reset_index().values.tolist()
# [['store1', 'January', 2],
#  ['store1', 'February', 3],
#  ['store1', 'March', 4],
#  ['store2', 'January', 5],
#  ['store2', 'February', 6],
#  ['store2', 'March', 7],
#  ['store3', 'January', 8],
#  ['store3', 'February', 9],
#  ['store3', 'March', 10]]

Answer 2

真正的熊貓風格：

lst = [[*k, v] for k, v in df.unstack().swaplevel().to_dict().items()]

Answer 3

我更喜歡堆疊而不是卸載然后交換級別：

>>> df.stack().reset_index().to_numpy()
array([['store1', 'January', 2],
       ['store1', 'February', 3],
       ['store1', 'March', 4],
       ['store2', 'January', 5],
       ['store2', 'February', 6],
       ['store2', 'March', 7],
       ['store3', 'January', 8],
       ['store3', 'February', 9],
       ['store3', 'March', 10]], dtype=object)
>>>

或者使用melt和ignore_index=False ：

>>> df.melt(ignore_index=False).reset_index().to_numpy()
array([['store1', 'January', 2],
       ['store2', 'January', 5],
       ['store3', 'January', 8],
       ['store1', 'February', 3],
       ['store2', 'February', 6],
       ['store3', 'February', 9],
       ['store1', 'March', 4],
       ['store2', 'March', 7],
       ['store3', 'March', 10]], dtype=object)
>>>

Answer 4

您希望數據采用的結構非常混亂，因此鑒於您想要的數據，這可能是最好的方法。

# Results
res = []

# Nested loop: first for length of index col, then next for cols
for i in range(len(index_col)):
    for j in range(len(cols)):
        # Format of data
        res.append([index_col[i], cols[j], values[i][j]])

# Return results
print(res)
return res

Answer 5

您可以使用

data = []

for col, row in df.items():
    for ind, val in row.reset_index().values:
        data.append([ind, col, val])

data

您可以避免犧牲您請求輸出的順序的第二個循環，因為它是結構如何開始的一個完整分解。

Answer 6

temp = df.stack()

[[*ent, val] for ent, val in zip(temp.index, temp)]

[['store1', 'January', 2],
 ['store1', 'February', 3],
 ['store1', 'March', 4],
 ['store2', 'January', 5],
 ['store2', 'February', 6],
 ['store2', 'March', 7],
 ['store3', 'January', 8],
 ['store3', 'February', 9],
 ['store3', 'March', 10]]

從現有的列名在 Pandas DataFrame 中創建一個新列

問題描述

6 個解決方案

解決方案1
9 已采納 2021-11-10 00:03:36

解決方案2
5 2021-11-10 00:04:16

解決方案3
3 2021-11-10 03:14:18

解決方案4
2 2021-11-09 23:58:43

解決方案5
2 2021-11-10 00:01:35

解決方案6
2 2021-11-10 00:08:28

從現有的列名在 Pandas DataFrame 中創建一個新列

問題描述

6 個解決方案

解決方案1 9 已采納 2021-11-10 00:03:36

解決方案2 5 2021-11-10 00:04:16

解決方案3 3 2021-11-10 03:14:18

解決方案4 2 2021-11-09 23:58:43

解決方案5 2 2021-11-10 00:01:35

解決方案6 2 2021-11-10 00:08:28

解決方案1
9 已采納 2021-11-10 00:03:36

解決方案2
5 2021-11-10 00:04:16

解決方案3
3 2021-11-10 03:14:18

解決方案4
2 2021-11-09 23:58:43

解決方案5
2 2021-11-10 00:01:35

解決方案6
2 2021-11-10 00:08:28