簡體   English   中英

如何正確應用 pandas 系列提取方法?

[英]How to apply pandas series extract method correctly?

想要用破折號分隔每一行的值和

看了安迪·海登的回答后

我正在分組U , 33A, A

使用(?P<Line>^\d{1,2}|^.|.*, .)

從行U-2022W-ZZ5891等。 等等

並嘗試使用df[0] = df[0].str.extract(r'(?P<Line>^\d{1,2}|^.|.*, .)')申請,我不確定如何繼續分組以從開始到結束。

col0
U-2022W-ZZ5891
U-2014X-7073
U-2010X-45
33-2010X-ZZ45
A、A-2010X-45
U-1996W-M-ZZ5891

從這里⬆️(向上箭頭)到這里⬇️(向下箭頭)

col0 col1 col2 col3
ü 2022W ZZ5891
ü 2014X 7073
ü 2010X 45
33 2010X ZZ45
一個,一個 2010X 45
ü 1996W ZZ5891

你可以使用這個正則表達式:

new_df = df['col0'].str.extract('(.+?)-(.+?)-(?:(.+?)-)?(.+)').fillna('')

Output:

>>> new_df
      0      1  2       3
0     U  2022W     ZZ5891
1     U  2014X       7073
2     U  2010X         45
3    33  2010X       ZZ45
4  A, A  2010X         45
5     U  1996W  M  ZZ5891

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM