[英]Extract string pattern from data frame using python
我有一栏 dataframe df
如下:
第 1 列 |
---|
638hshsys-名称123x73632 |
ydgcg2763,sd8nameyux2ksdj |
name2ux@SDJ sLlsakdal |
我想从该列中提取与模式namexxx
匹配的 substring 并创建一个新的column2 ,即单词name
和以下 3 个字符,如下所示:
第 1 列 | 第 2 列 |
---|---|
638hshsys-名称123x73632 | 名称123 |
ydgcg2763,sd8nameyux2ksdj | 名称yux |
name2ux@SDJ sLlsakdal | 名称2ux |
我们可以将Series.str.extract
与正则表达式模式一起使用,其中匹配长度为 3 的“任何”字符:
df['column2'] = df['column1'].str.extract("(name.{3})")
column1 column2
0 638hshsys-name123x73632 name123
1 ydgcg2763,sd8nameyux2ksdj nameyux
2 name2ux@SDJ sLlsakdal name2ux
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.