繁体   English   中英

将数据从一列拆分并创建到多列

[英]Split and create data from a column to many columns

我有一个 pandas 数据框,其中一列的值看起来像这样

print(VCF['INFO'].iloc[0])

结果(对不起,我可以在没有互联网连接的情况下从集群工作时复制和粘贴此数据)

在此处输入图像描述

我需要创建名为 END、SVTYPE 和 SVLEN 的新列,并将它们的信息作为该列的值。 按照示例,这将是

END         SVTYPE   SVLEN-
224015456    DEL     223224913

到目前为止,INFOI 列中包含的信息的 rest 不需要它。 本专栏中包含的信息是巨大的,但据我所知,没有更多的东西=价值,正如您在图片中看到的那样。

只需使用.str.extract

extracted = df['INFO'].str.extract('END=(?P<END>.+?);SVTYPE=(?P<SVTYPE>.+?);SVLEN=(?P<SVLEN>.+?);')

Output:

>>> extracted
         END SVTYPE       SVLEN
0  224015456    DEL  -223224913

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM