[英]reading and extracting data from file using python
我是python的新手,我想从这种格式中提取数据
<seq id> <alignment start> <alignment end> <envelope start> <envelope end> <hmm acc> <hmm name> <type> <hmm start> <hmm end> <hmm length> <bit score> <E-value> <significance> <clan>
**FBpp0143497** **5 151** 5 157 PF00339.22 **Arrestin_N** Domain 1 135 149 83.4 **1.1e-23** 1 CL0135
**FBpp0143497** **183 323** 183 324 PF02752.15 Arrestin_C Domain 1 137 138 58.5 **6e-16** 1 CL0135
FBpp0131987 60 280 51 280 PF00089.19 Trypsin Domain 14 219 219 127.7 3.7e-37 1 CL0124
此格式
>FBpp0143497
5 151 Arrestin_N 1.1e-23
>FBpp0143497
183 323 Arrestin_C 6e-16
您可以使用空格作为定界符,使用“ csv”模块解析文件。 请参阅csv.reader的文档
由于这是蛋白质组数据,因此您可能会在BioPython包中找到专用的解析器
您可以使用split()在空格处分隔项目,然后从返回的列表中打印出所需的值。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.