如何計算大型 FASTA 文件中包含的序列的氨基酸組成百分比

Question

我想計算 FASTA 文件中單獨包含的每個序列的氨基酸組成，但我很難做到這一點。 我知道我可以使用下面的代碼來做到這一點，但這涉及我分別輸入每個序列，而不是將 FASTA 文件作為一個整體並以這種方式計算。

from Bio.SeqUtils.ProtParam import ProteinAnalysis 
X = ProteinAnalysis("MAEGEITTFTALTEKFNLPPGNYKKPKLLYCSNGGHFLRILPDGTVDGT" 
                "RDRSDQHIQLQLSAESVGEVYIKSTETGQYLAMDTSGLLYGSQTPSEEC" 
                "LFLERLEENHYNTYTSKKHAEKNWFVGLKKNGSCKRGPRTHYGQKAILF" 
                "LPLPV") 
print(X.count_amino_acids()['A']) 
print(X.count_amino_acids()['E']) 
print("%0.2f" % X.get_amino_acids_percent()['K']) 
print("%0.2f" % X.get_amino_acids_percent()['L']) 
print("%0.2f" % X.molecular_weight()) 
print("%0.2f" % X.aromaticity()) 
print("%0.2f" % X.instability_index()) 
print("%0.2f" % X.isoelectric_point()) 
sec_struc = X.secondary_structure_fraction() 
print("%0.2f" % sec_struc[0]) 
epsilon_prot = X.molar_extinction_coefficient()  
print(epsilon_prot[0])   
print(epsilon_prot[1])

Answer 1

您只需要使用SeqIO.parse()讀取序列的 FASTA 文件：

from Bio import SeqIO
from Bio.SeqUtils.ProtParam import ProteinAnalysis

for record in SeqIO.parse('myfasta.fa', 'fasta'):
    X = ProteinAnalysis(str(record.seq))
    print('\n### Results for record: {} ###'.format(record.id))
    print(X.count_amino_acids()['A']) 
    print(X.count_amino_acids()['E']) 
    print("%0.2f" % X.get_amino_acids_percent()['K']) 
    print("%0.2f" % X.get_amino_acids_percent()['L']) 
    print("%0.2f" % X.molecular_weight()) 
    print("%0.2f" % X.aromaticity()) 
    print("%0.2f" % X.instability_index()) 
    print("%0.2f" % X.isoelectric_point()) 
    sec_struc = X.secondary_structure_fraction() 
    print("%0.2f" % sec_struc[0]) 
    epsilon_prot = X.molar_extinction_coefficient()  
    print(epsilon_prot[0])   
    print(epsilon_prot[1])

Answer 2

我想你想從FastaIO模塊中得到一些東西，例如：

from Bio.SeqUtils.ProtParam import ProteinAnalysis 
from Bio.SeqIO import FastaIO

with open('myfile.fasta') as fd:
  for name, sequence in FastaIO.SimpleFastaParser(fd):
     X = ProteinAnalysis(sequence)
     print(name, X.count_amino_acids()['A'])

以及任何你想計算的

如何計算大型 FASTA 文件中包含的序列的氨基酸組成百分比

問題描述

2 個解決方案

解決方案1
2 已采納 2019-07-30 15:54:26

解決方案2
1 2019-07-30 15:54:48

如何計算大型 FASTA 文件中包含的序列的氨基酸組成百分比

問題描述

2 個解決方案

解決方案1 2 已采納 2019-07-30 15:54:26

解決方案2 1 2019-07-30 15:54:48

解決方案1
2 已采納 2019-07-30 15:54:26

解決方案2
1 2019-07-30 15:54:48