如何正確應用 pandas 系列提取方法？

Question

想要用破折號分隔每一行的值和

我正在分組U , 33和A, A

使用(?P<Line>^\d{1,2}|^.|.*, .)

從行U-2022W-ZZ5891等。 等等

並嘗試使用df[0] = df[0].str.extract(r'(?P<Line>^\d{1,2}|^.|.*, .)')申請，我不確定如何繼續分組以從開始到結束。

col0
U-2022W-ZZ5891
U-2014X-7073
U-2010X-45
33-2010X-ZZ45
A、A-2010X-45
U-1996W-M-ZZ5891

從這里⬆️（向上箭頭）到這里⬇️（向下箭頭）

col0	col1	col2	col3
ü	2022W		ZZ5891
ü	2014X		7073
ü	2010X		45
33	2010X		ZZ45
一個，一個	2010X		45
ü	1996W	米	ZZ5891

Answer 1

你可以使用這個正則表達式：

new_df = df['col0'].str.extract('(.+?)-(.+?)-(?:(.+?)-)?(.+)').fillna('')

Output：

>>> new_df
      0      1  2       3
0     U  2022W     ZZ5891
1     U  2014X       7073
2     U  2010X         45
3    33  2010X       ZZ45
4  A, A  2010X         45
5     U  1996W  M  ZZ5891

如何正確應用 pandas 系列提取方法？

問題描述

1 個解決方案

解決方案1
1 2022-01-29 22:48:08

如何正確應用 pandas 系列提取方法？

問題描述

1 個解決方案

解決方案1 1 2022-01-29 22:48:08

解決方案1
1 2022-01-29 22:48:08