繁体   English   中英

使用 python 从数据帧中提取字符串模式

[英]Extract string pattern from data frame using python

我有一栏 dataframe df如下:

第 1 列
638hshsys-名称123x73632
ydgcg2763,sd8nameyux2ksdj
name2ux@SDJ sLlsakdal

我想从该列中提取与模式namexxx匹配的 substring 并创建一个新的column2 ,即单词name和以下 3 个字符,如下所示:

第 1 列 第 2 列
638hshsys-名称123x73632 名称123
ydgcg2763,sd8nameyux2ksdj 名称yux
name2ux@SDJ sLlsakdal 名称2ux

我们可以将Series.str.extract与正则表达式模式一起使用,其中匹配长度为 3 的“任何”字符:

df['column2'] = df['column1'].str.extract("(name.{3})")

                     column1  column2
0    638hshsys-name123x73632  name123
1  ydgcg2763,sd8nameyux2ksdj  nameyux
2      name2ux@SDJ sLlsakdal  name2ux

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM