[英]accumulating values to corresponding key in a dictionary?
我正在尝试定位碱基(A、C、G、T)的位置并将它们放入与其位置对应的字典中。
我正在使用一个文本文件,该文件具有如下所示的基数行
----T
C
-C
-----G
C
-----C
---T
----A
----C
-----G
从上面的信息,我知道
C 在第 1 个位置
C 在第 2 位
第三位基数未知
T 在第 4 位
C、A、T 位于第 5 位
C、G 在第 6 位
到目前为止,我已经写了下面的代码
def chunks(chunks_file):
set_bases = {}
with open(chunks_file) as file:
for line in file:
for character in line:
if character.isalpha():
letter = character
position = line.find(letter) + 1
set_bases[position] = {letter}
return set_bases
我目前的输出是:
{5: {'C'}, 1: {'C'}, 2: {'C'}, 6: {'G'}, 4: {'T'}}
所需的输出是:
{1: {'C'}, 2: {'C'}, 4: {'T'}, 5: {'C', 'A', 'T'}, 6: {'C', 'G'}}
在我看来,值并未添加到现有的键中,但新值正在替换旧值。
我怎么解决这个问题?
考虑到您有一个txt
文件,您可以通过以下方式进行操作:
outDict = {}
with open('data.txt', 'r') as inFile:
lines = [line.strip() for line in inFile if not line == '\n']
outDict = dict((str(line.count('-')+1),set()) for line in lines)
for line in lines:
outDict[str(line.count('-')+1)].update(line[-1])
print(outDict)
结果:
{'5': {'C', 'A', 'T'}, '1': {'C'}, '2': {'C'}, '6': {'C', 'G'}, '4': {'T'}}
我可以提出以下改进建议:
import collections
def chunks(filename):
bases = collections.defaultdict(set)
with open(filename) as f:
for line in f:
line = line.strip()
if len(line) > 0:
for i, char in enumerate(line):
if char.isalpha():
position = i + 1
bases[position].add(char)
return bases
collections.defaultdict
因此您不必检查该位置是否存在于 dict 中。enumerate()
,所以你已经有了位置,不需要调用line.find()
。此代码可以按如下方式使用:
>>> d = chunks('your-file-name.txt')
>>> d
defaultdict(<class 'set'>, {5: {'T', 'C', 'A'}, 1: {'C'}, 2: {'C'}, 6: {'G', 'C'}, 4: {'T'}})
>>> dict(d)
{5: {'C', 'A', 'T'}, 1: {'C'}, 2: {'C'}, 6: {'G', 'C'}, 4: {'T'}}
>>> for k, v in sorted(d.items()):
... print(k, v)
1 {'C'}
2 {'C'}
4 {'T'}
5 {'C', 'A', 'T'}
6 {'G', 'C'}
尝试这样的事情:
def chunks(chunks_file):
set_bases = {}
with open(chunks_file) as file:
for line in file:
for character in line:
if character.isalpha():
letter = character
position = line.find(letter) + 1
if position in set_bases:
set_bases[position].append(letter)
else:
set_bases[position] = [letter]
return set_bases
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.