繁体   English   中英

如果找到某些文件,如何简单地遍历目录和子目录并创建存档

[英]How to simply walk through directories and subdirectories and create archive if found certain files

我想创建 2 个脚本。 首先负责遍历父文件夹中的所有子目录,查找扩展名为"*.mp4", "*.txt","*.jpg"文件,如果找到包含这三个文件的文件夹(例如testfolder ),另一个脚本执行创建存档testfolder.tar操作。

这是我用于测试这些脚本的目录树: https : //imgur.com/4cX5t5N

rootDirectory包含parentDirectory1parentDirectory2 parentDirectories包含childDirectories

这是dirScanner.py尝试打印子目录中文件扩展名的代码:

import os

rootdir = r'C:\Users\user\pythonprogram\rootDirectory'
for directory in os.walk(rootdir):
    for subdirectory in directory:
        extensions = []
        if os.path.isfile(os.curdir):
            extensions.append(os.path.splitext(os.curdir)[-1].lower())
        print(extensions)

然而,它绝对不能像我期望的那样工作。 我应该如何遍历rootDirectory parentDirectorieschildDirectiories

我想保持简单,以“好吧我在这个目录中,这个目录的文件是XXX,应该/不应该打包它们”的方式

此外,这是我的另一个脚本,应该负责为指定路径打包文件。 我正在尝试学习如何使用类,但我不知道我是否理解正确。

import tarfile

class folderNeededToBePacked:
    def __init__(self, name, path):
        self.path = path
        self.name = name
    def pack(self):
        tar = tarfile.open(r"{0}/{1}.tar".format(self.path, self.name), "w")
        for file in self.path:
            tar.add(file)
        tar.close()

我将感谢所有关于如何实现此任务目标的提示和建议。

这是一个简单直接的任务,没有很多复杂的概念,需要作为一个类来实现,所以我不会为此使用一个。

这个想法是遍历所有目录(递归),如果找到匹配的目录,则将该目录的三个文件打包到存档中。

要遍历目录树,您需要根据其文档修复“os.walk()”的用法:

tar = tarfile.open(...)
for dirpath, dirnames, filenames in os.walk(root):
  found_files = dir_matching(root, dirpath)
  for found_file in found_files:
    tar.add(found_file)
tar.close()

并且函数dir_matching()应该返回三个找到的文件的列表(如果目录不匹配,则返回一个空列表,即至少缺少三个必要文件之一):

def dir_matching(root, dirpath):
  jpg = glob.glob(os.path.join(root, dirpath, '*.jpg')
  mp4 = glob.glob(os.path.join(root, dirpath, '*.mp4')
  txt = glob.glob(os.path.join(root, dirpath, '*.txt')
  if jpg and mp4 and txt:
    return [ jpg[0], mp4[0], txt[0] ]
  else:
    return []

当然,您可以添加更复杂的检查,例如是否找到一个 jpg 等,但这取决于您的具体规格。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM