如何從字符串中提取所有重復模式到 dataframe

Question

我有一個帶有某些卡車設備代碼的 dataframe，這是一個類似的單元格列表

x = [[A0B,A1C,A1Z,A2E,A5C,B1B,B1F,B1H,B2A],
 [A0A,A0B,A1C,A1Z,A2I,A5L,B1B,B1F,B1H,B2A,B2X,B3H,B4L,B5E,B5J,C0G,C1W,C5B,C5D],
 [A0B,A1C,A1Z,A2E,A5C,B1B,B1F,B1H,B2A,B2X,B4L,B5C,B5I,C0A,C1J,C5B,C5D,C6C,C6J,C6Q]]

我想提取與 "B" 匹配的所有值，例如 ("B1B,B1F,B1H");("B1B,B1F,B1H,B2A,B2X,B3H")("B1B,B1F,B1H,B2A, B2X,B4L,B5C,B5I") 我試試這個代碼，但每一行每一行都有不同的長度 sublista = ['B1B','B1F','B1H','B2A','B2X','B4L',' B5C','B5I']

df3 = pd.DataFrame(columns=['FIN', 'Equipmentcodes', 'AQUATARDER', 'CAJA'])
for elemento in sublista:
 df_aux=(df2[df2['Equipmentcodes'].str.contains(elemento, case=False)])
 df_aux['CAJA'] = elemento
 df3 = df3.append(df_aux, ignore_index=True)

在此處輸入圖像描述

Answer 1

假設您的列包含字符串，您可以使用正則表達式：

df['selected'] = (df['code']
                  .str.extractall(r'\b(B[^,]*)\b')[0]
                  .groupby(level=0).apply(','.join)
                 )

示例輸入：

x = ['A0B,A1C,A1Z,A2E,A5C,B1B,B1F,B1H,B2A',
     'A0A,A0B,A1C,A1Z,A2I,A5L,B1B,B1F,B1H,B2A,B2X,B3H,B4L,B5E,B5J,C0G,C1W,C5B,C5D',
     'A0B,A1C,A1Z,A2E,A5C,B1B,B1F,B1H,B2A,B2X,B4L,B5C,B5I,C0A,C1J,C5B,C5D,C6C,C6J,C6Q']

df = pd.DataFrame({'code': x})

output：

                              selected                                                                             code
0                      B1B,B1F,B1H,B2A                                              A0B,A1C,A1Z,A2E,A5C,B1B,B1F,B1H,B2A
1  B1B,B1F,B1H,B2A,B2X,B3H,B4L,B5E,B5J      A0A,A0B,A1C,A1Z,A2I,A5L,B1B,B1F,B1H,B2A,B2X,B3H,B4L,B5E,B5J,C0G,C1W,C5B,C5D
2      B1B,B1F,B1H,B2A,B2X,B4L,B5C,B5I  A0B,A1C,A1Z,A2E,A5C,B1B,B1F,B1H,B2A,B2X,B4L,B5C,B5I,C0A,C1J,C5B,C5D,C6C,C6J,C6Q

如何從字符串中提取所有重復模式到 dataframe

問題描述

1 個解決方案

解決方案1
0 已采納 2022-01-05 12:02:03

如何從字符串中提取所有重復模式到 dataframe

問題描述

1 個解決方案

解決方案1 0 已采納 2022-01-05 12:02:03

解決方案1
0 已采納 2022-01-05 12:02:03