![](/img/trans.png)
[英]How to convert a set of DNA sequences into protein sequences using python programming?
[英]How to turn DNA list sequences into Protein sequences in Python
以下是我正在使用的当前价值观:
DNA_list=['ATTGAT','CTGGCA','TAGGAC','GAGGCT'] #transcription
RNA_list=['UAACUA','GACCGU','AUCCUG','CUCCGA']
protein_list=['_L','DV','IL','LR']
我需要帮助将 DNA 序列列表转换为蛋白质序列。 本质上,程序应该读取 3 对 RNA_list 以模拟密码子读取,然后获取 3 个序列并从字典或任何存储有氨基酸的东西(例如 BioPython 或其他一些模块)中提取值。 这是我到目前为止所拥有的,但我只能从单个序列而不是列表中完成此操作:
codon = {"AAA":"K", "AAC":"N", "AAG":"K", "AAU":"N",
"ACA":"T", "ACC":"T", "ACG":"T", "ACU":"T",
"AGA":"R", "AGC":"S", "AGG":"R", "AGU":"S",
"AUA":"I", "AUC":"I", "AUG":"M", "AUU":"I",
"CAA":"Q", "CAC":"H", "CAG":"Q", "CAU":"H",
"CCA":"P", "CCC":"P", "CCG":"P", "CCU":"P",
"CGA":"R", "CGC":"R", "CGG":"R", "CGU":"R",
"CUA":"L", "CUC":"L", "CUG":"L", "CUU":"L",
"GAA":"E", "GAC":"D", "GAG":"E", "GAU":"D",
"GCA":"A", "GCC":"A", "GCG":"A", "GCU":"A",
"GGA":"G", "GGC":"G", "GGG":"G", "GGU":"G",
"GUA":"V", "GUC":"V", "GUG":"V", "GUU":"V",
"UAA":"_", "UAC":"Y", "UAG":"_", "UAU":"T",
"UCA":"S", "UCC":"S", "UCG":"S", "UCU":"S",
"UGA":"_", "UGC":"C", "UGG":"W", "UGU":"C",
"UUA":"L", "UUC":"F", "UUG":"L", "UUU":"F"}
protein_seq = ""
for x in range(0, len(RNA_list),3):
codon=RNA_list[i:i+3]
protein_seq += RNA_codon[codon]
同样的问题是这仅适用于单个序列,而不适用于列表。 任何帮助将不胜感激!
这行不通?
result = []
for rna in RNA_list:
protein_seq = ""
for i in range(0, len(rna),3):
codon=rna[i:i+3]
protein_seq += RNA_codon[codon]
result.append(protein_seq)
result = []
for rna in RNA_list:
protein_seq = ""
for i in range(0, len(rna), 3):
rna_codon = codon[rna[i:i+3]]
protein_seq += rna_codon
result.append(protein_seq)
print(result)
i
和x
是不同的变量。 您需要两个循环,外部循环遍历序列列表,内部循环遍历每个序列。
请注意,结果与protein_list
不同,第二个元素是DR
,而不是DV
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.