繁体   English   中英

如何从多个文本文件中获取元组列表(第 2 部分:Electric Boogaloo)?

[英]How to get a list of tuples from several text files (Part 2: Electric Boogaloo)?

由于我的第一个问题不够清楚,我将重写它,使其更清楚(对不起,我在第一个问题中不清楚)。

我有一个包含 46 个子目录的文件夹。 每个子目录都有一个.txt 文件。 这些.txt 文件中的文本行数不同,如下所示:

0
0
0
1
...
1
0
0
1

我想要一个包含 46 个元组的列表(每个子目录 1 个 - 以及每个 .txt 文件),在这些元组中,我想要文本中包含 0 的行数和包含 1 的行数对于该元组分配到的文件。 类似这样的东西:

[(17342,2453),(342,127),...,(45003,69),(420,223)]

目前我的代码(不能正常工作)是这样的:

from pathlib import Path

def count_0s(paths):
  for p in paths:
    list_zeros = []
    list_ones = []
    for line in p.read_text().splitlines():
      zeros = 0
      zeros += line.count('0')
      ones = 0
      ones += line.count('1')
    list_zeros.append(zeros)
    list_ones.append(ones)    
  return list_zeros, list_ones

path = "/content/drive/MyDrive/data/classes/"
paths = Path(path).glob("*/marked*.txt")
n_zeros=count_0s(paths)
n_zeros

我需要应用哪些更改,以便我有一个包含元组的列表,而不是 2 个列表?

假设您有两个列表,第一个包含 0 的数量,第二个包含 1 的数量,您可以在最后重新排列数据:

n_zeros = [1, 2, 3, 4]
n_ones = [5, 6, 7, 8]

pairs = []
for n_zero, n_one in zip(n_zeros, n_ones):
    pairs.append((n_zero, n_one))

print(pairs)

应该返回

[(1, 5), (2, 6), (3, 7), (4, 8)]

更好的方法是在主循环中进行配对,而不是保存两个列表。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM