使用python从文件读取和提取数据

Question

我是python的新手，我想从这种格式中提取数据

<seq id> <alignment start> <alignment end> <envelope start> <envelope end> <hmm acc> <hmm name> <type> <hmm start> <hmm end> <hmm length> <bit score> <E-value> <significance> <clan>

**FBpp0143497**      **5    151**      5    157 PF00339.22  **Arrestin_N**        Domain     1   135   149     83.4   **1.1e-23**   1 CL0135   
**FBpp0143497**    **183    323**    183    324 PF02752.15  Arrestin_C        Domain     1   137   138     58.5     **6e-16**   1 CL0135   
FBpp0131987     60    280     51    280 PF00089.19  Trypsin           Domain    14   219   219    127.7   3.7e-37   1 CL0124

此格式

>FBpp0143497
 5      151        Arrestin_N     1.1e-23

>FBpp0143497
 183    323        Arrestin_C     6e-16

Answer 1

您可以使用空格作为定界符，使用“ csv”模块解析文件。 请参阅csv.reader的文档

Answer 2

由于这是蛋白质组数据，因此您可能会在BioPython包中找到专用的解析器

Answer 3

您可以使用split（）在空格处分隔项目，然后从返回的列表中打印出所需的值。

使用python从文件读取和提取数据

问题描述

3 个解决方案

解决方案1
1 2010-05-19 10:02:20

解决方案2
1 2010-05-19 10:18:12

解决方案3
0 2011-03-31 21:20:26

使用python从文件读取和提取数据

问题描述

3 个解决方案

解决方案1 1 2010-05-19 10:02:20

解决方案2 1 2010-05-19 10:18:12

解决方案3 0 2011-03-31 21:20:26

解决方案1
1 2010-05-19 10:02:20

解决方案2
1 2010-05-19 10:18:12

解决方案3
0 2011-03-31 21:20:26