如何從列中拆分數據並從 dataframe 添加到列表中，還重復單行的列表元素？（熊貓）

Question

我有一個數據框

  Product  Photo 1  Photo 2 Photo 3 Photo 4  Price
  Shirt    a.jpg    b.jpg   c.jpg   d.jpg     100
  Pant     e.jpg                              245
  Coat     f.jpg    g.jpg                     433

列表為

values = [['A,'B','C'],['D','E','F','G'],['H','I','J','K]]

應該添加這些數據幀，並且應該從索引值[2] 開始，並且列表應該根據數據幀中的行數從索引開始增加。 列也應該像 output 格式一樣拆分。 元素應該為每一行循環。

預期 output

values = [['A,'B','C'],['D','E','F','G'],['PHOTO','a.jpg'],['PHOTO','b.jpg'],
          ['PHOTO','c.jpg'],['PHOTO','d.jpg'],['H','I','J','K],
          ['A,'B','C'],['D','E','F','G'],
          ['PHOTO','e.jpg'],['H','I','J','K], ['A,'B','C'],['D','E','F','G'], 
          ['PHOTO','f.jpg',], ['PHOTO','g.jpg'], ['H','I','J','K]
          ]

然后，我想將此列表轉換為數據框。 我試過的：

L = [df.loc[:, x].set_axis(range(len(x)), axis=1) for x in values]
df = pd.concat(L).sort_index(kind='mergesort').fillna('').reset_index(drop=True)
df = df.fillna('')

output 來自上例中的此代碼：

A  B  C  
D  E  F  G
H  I  J  K


 #the data frame repeats till the number of rows in the previous df.

Answer 1

將嵌套列表理解與添加PHOTO然后values列表一起使用：

values = [['A','B','C'],['D','E','F','G'],['H','I','J','K']]

df1 = df.fillna('').filter(like='Photo')
print (df1)
  Photo 1 Photo 2 Photo 3 Photo 4
0   a.jpg   b.jpg   c.jpg   d.jpg
1   e.jpg                        
2   f.jpg   g.jpg 


out = [y for x in df1.to_numpy() 
         for y in values[:2] + [['PHOTO', z] for z in x[x!='']] + values[2:]]
print (out)
[['A', 'B', 'C'], ['D', 'E', 'F', 'G'], ['PHOTO', 'a.jpg'], ['PHOTO', 'b.jpg'], ['PHOTO', 'c.jpg'], ['PHOTO', 'd.jpg'], ['H', 'I', 'J', 'K'], 
 ['A', 'B', 'C'], ['D', 'E', 'F', 'G'], ['PHOTO', 'e.jpg'], ['H', 'I', 'J', 'K'],
 ['A', 'B', 'C'], ['D', 'E', 'F', 'G'], ['PHOTO', 'f.jpg'], ['PHOTO', 'g.jpg'], ['H', 'I', 'J', 'K']]

Answer 2

你可以嘗試這樣的事情：

rows = [
        ['PHOTO'] + r.strip().split() 
        for r in df.filter(regex = 'Photo').to_string(header = False, index = False).split('\n')
       ]
values = values[:2] + rows + values[2:]

Output

values
[['A', 'B', 'C'], ['D', 'E', 'F', 'G'], ['PHOTO', 'a.jpg', 'b.jpg', 'c.jpg', 'd.jpg'], ['PHOTO', 'e.jpg'], ['PHOTO', 'f.jpg', 'g.jpg'], ['H', 'I', 'J', 'K']]

如果空單元格是None ，那么你必須先這樣做：

df = df.fillna('')

修改后更新：

jpgs =  df.filter(regex = 'Photo').stack()
rows = [["PHOTO", jpg] for jpg in jpgs[jpgs != ''].unique()]
values = values[:2] + rows + values[2:]

Output

values
[['A', 'B', 'C'], ['D', 'E', 'F', 'G'], ['PHOTO', 'a.jpg'], ['PHOTO', 'b.jpg'], ['PHOTO', 'c.jpg'], ['PHOTO', 'd.jpg'], ['PHOTO', 'e.jpg'], ['PHOTO', 'f.jpg'], ['PHOTO', 'g.jpg'], ['H', 'I', 'J', 'K']]

如何從列中拆分數據並從 dataframe 添加到列表中，還重復單行的列表元素？（熊貓）

問題描述

2 個解決方案

解決方案1
1 已采納 2021-03-24 06:44:59

解決方案2
0 2021-03-22 07:56:03

如何從列中拆分數據並從 dataframe 添加到列表中，還重復單行的列表元素？ （熊貓）

問題描述

2 個解決方案

解決方案1 1 已采納 2021-03-24 06:44:59

解決方案2 0 2021-03-22 07:56:03

如何從列中拆分數據並從 dataframe 添加到列表中，還重復單行的列表元素？（熊貓）

解決方案1
1 已采納 2021-03-24 06:44:59

解決方案2
0 2021-03-22 07:56:03