![](/img/trans.png)
[英]How do I convert the three letter amino acid codes to one letter code with python or R?
[英]How to find the codons that codes for the same amino acid in python?
我有一個包含所有密碼子和氨基酸的txt文件,看起來像這樣:
CTT L
ATG M
ACA T
ACG T
ATC I
AAC N
ATA I
AGG R
CCT P
ACT T
AGC S
AAG K
AGA R
CAT H
AAT N
ATT I
CTG L
CTA L
CTC L
CAC H
AAA K
CCG P
AGT S
CCA P
CAA Q
CCC P
TAT Y
GGT G
TGT C
CGA R
CAG Q
TCT S
GAT D
CGG R
TTT F
TGC C
GGG G
TAG *
GGA G
TAA *
GGC G
TAC Y
TTC F
TCG S
TTA L
TTG L
TCC S
ACC T
TCA S
GCA A
GTA V
GCC A
GTC V
GCG A
GTG V
GAG E
GTT V
GCT A
TGA *
GAC D
CGT R
TGG W
GAA E
CGC R
我如何檢索這些信息並以每種氨基酸顯示其對應密碼子的方式進行輸出。 喜歡:
F [TTT, TTC]
L [TTA, TTG, CTT, CTC, CTA, CTG]
......
任何人?
重要編輯:必須設置結果DICT的值,而不是列表!
如果這是在名為codons
的字符串中,則可以執行以下操作:
result = {}
for c in codons.strip().split('\n'):
codon, amino = c.split()
result.setdefault(amino, set()).add(codon)
for r in result:
print r, result[r]
編輯:如果您已經在字典中有數據,只需跳過“解析”並直接使用dict.iteritems()
,它是dict的項(鍵值對)的迭代器:
result = {}
for codon, amino in codonsdict.iteritems():
result.setdefault(amino, set()).add(codon)
for r in result:
print r, result[r]
使用setdefault(key, default)
很重要,因為必須在第一次出現鍵時創建一個空的鍵值默認對。
希望這可以幫助!
我給你你要的字典。 但是將來,請讓我們知道這是否是一項家庭作業。
codon_table = {
'A': ('GCT', 'GCC', 'GCA', 'GCG'),
'C': ('TGT', 'TGC'),
'D': ('GAT', 'GAC'),
'E': ('GAA', 'GAG'),
'F': ('TTT', 'TTC'),
'G': ('GGT', 'GGC', 'GGA', 'GGG'),
'I': ('ATT', 'ATC', 'ATA'),
'H': ('CAT', 'CAC'),
'K': ('AAA', 'AAG'),
'L': ('TTA', 'TTG', 'CTT', 'CTC', 'CTA', 'CTG'),
'M': ('ATG',),
'N': ('AAT', 'AAC'),
'P': ('CCT', 'CCC', 'CCA', 'CCG'),
'Q': ('CAA', 'CAG'),
'R': ('CGT', 'CGC', 'CGA', 'CGG', 'AGA', 'AGG'),
'S': ('TCT', 'TCC', 'TCA', 'TCG', 'AGT', 'AGC'),
'T': ('ACT', 'ACC', 'ACA', 'ACG'),
'V': ('GTT', 'GTC', 'GTA', 'GTG'),
'W': ('TGG',),
'Y': ('TAT', 'TAC'),
'*': ('TAA', 'TAG', 'TGA'),
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.