[英]How to apply pandas series extract method correctly?
想要用破折號分隔每一行的值和
看了安迪·海登的回答后
我正在分組U
, 33
和A, A
使用(?P<Line>^\d{1,2}|^.|.*, .)
從行U-2022W-ZZ5891
等。 等等
並嘗試使用df[0] = df[0].str.extract(r'(?P<Line>^\d{1,2}|^.|.*, .)')
申請,我不確定如何繼續分組以從開始到結束。
col0 |
---|
U-2022W-ZZ5891 |
U-2014X-7073 |
U-2010X-45 |
33-2010X-ZZ45 |
A、A-2010X-45 |
U-1996W-M-ZZ5891 |
從這里⬆️(向上箭頭)到這里⬇️(向下箭頭)
col0 | col1 | col2 | col3 |
---|---|---|---|
ü | 2022W | ZZ5891 | |
ü | 2014X | 7073 | |
ü | 2010X | 45 | |
33 | 2010X | ZZ45 | |
一個,一個 | 2010X | 45 | |
ü | 1996W | 米 | ZZ5891 |
你可以使用這個正則表達式:
new_df = df['col0'].str.extract('(.+?)-(.+?)-(?:(.+?)-)?(.+)').fillna('')
Output:
>>> new_df
0 1 2 3
0 U 2022W ZZ5891
1 U 2014X 7073
2 U 2010X 45
3 33 2010X ZZ45
4 A, A 2010X 45
5 U 1996W M ZZ5891
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.