![](/img/trans.png)
[英]Reading multiple sheets dynamically in pandas and store in different data frames
[英]Reading at three different frames
所以我正在尝试创建一个类,它在三个不同的帧中读取DNA字符串 - 一个从位置0(或第一个碱基)开始,另一个从位置1开始(第二个碱基),第三个开始读取在第2位(第三垒)。 到目前为止,这是我一直在玩的:
def codons(self, frame_one, frame_two, frame_three):
start = frame_one
while start + 3 <=len(self.seq):
yield (self.seq[start:start+3], start)
start += 3
start+1 = frame_two
while start + 3 <=len(self.seq):
yield (self.seq[start+1:start+4], start)
start += 3
start+2 = frame_three
while start + 3 <=len(self.seq):
yield (self.seq[start+2:start+5], start)
start += 3
我认为现在这几乎是胡说八道,但我尽我所能。 如果有人能让我知道我可以在这堂课中开始纠正的地方,那就太棒了。
首先,您不能指定一些值并命名变量,如start+1
, start+2
等。 接下来,由于它与生物信息学相关,您可以将您的问题标记为生物信息学。 此外,你重复了很多次的东西,这对程序员来说太糟糕了。 但是,您可以尝试使用以下代码段:
class Codons(object):
def __init__(self, seq):
self.seq = seq
def codons(self, frame_one, frame_two, frame_three):
while frame_one <=len(self.seq):
yield (self.seq[frame_one:frame_one+3])
frame_one += 3
while frame_two <=len(self.seq):
yield (self.seq[frame_two:frame_two+3])
frame_two += 3
while frame_three <=len(self.seq):
yield (self.seq[frame_three:frame_three+3])
frame_three += 3
test_codons = Codons("ATCGTG-")
val = test_codons.codons(0,1,2)
print("Codons are: ")
for i in val:
print(i)
print("")
如果它适合您,请告诉我们。 干杯!!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.