Python / Itertools：按名称获取最新文件

Question

我在目录中有一个文件名列表，我只想保留最新版本。 该列表如下所示：

['file1-v1.csv', 'file1-v2.csv', 'file2-v1.txt', ...] 。

我只想按照版本（文件名中的-后）和txt文件保留最新的csv文件。

输出为[''file1-v2.csv', 'file2-v1.txt', ...]

我有一个需要使用集合的解决方案，但我正在寻找一种简单的pythonic方式来做到这一点。 可能使用itertools和groupby

更新：到目前为止的解决方案

我已经能够做一些初步的工作来获得像

lst = [('file1', 'csv', 'v1','<some data>'), ('file2', 'csv', 'v2','<some data>'), ...]

我想按索引0和1的元素进行分组，但仅提供具有最大索引2的元组。

可能类似于以下内容：

files = list(item for key, group in itertools.groupby(files, lambda x: x[0:2]) for item in group)
# Maximum over 3rd index element in each tuple does not work
files = max(files, key=operator.itemgetter(2))

另外，我觉得下面的方法应该可以，但是不能正确选择最大值

[max(items, key=operator.itemgetter(2)) for key, items in itertools.groupby(files, key=operator.itemgetter(0, 1))]

Answer 1

我会这样：

import os
import itertools

filenames = ['file1-v1.csv', 'file1-v2.csv', 'file1-v3.jpg', 'file2-v1.txt']


def split_filename(filename):
    basename, ext = os.path.splitext(filename)
    root, version = basename.rsplit('-v', 1)

    return root, ext, int(version)

def filter_latest_versions(filenames):
    parsed_filenames = sorted(map(split_filename, filenames))

    for _, matches in itertools.groupby(parsed_filenames, key=lambda f: f[:2]):
        root, ext, version = tuple(matches)[-1]

        yield '{}-v{}{}'.format(root, version, ext)

它与您现在发布的解决方案没有太大不同，但是可以正确地整理出不同的扩展名并使用名称中的破折号处理文件名。

Answer 2

您可以尝试以下方法：

a = ['file1-v1.csv', 'file1-v2.csv', 'file2-v1.txt','file4-v1.csv','file2-v2.txt','file2-v3.txt']
d = {}
for i in a:
    x = i.split("-")
    d[x[0]]= x[1]
    if x[0] in d:
        d[x[0]] = x[1]
    else:
        d[x[0]] = x[1] 

for x,y in d.items():
    print('-'.join((x,y)))

Python / Itertools：按名称获取最新文件

问题描述

2 个解决方案

解决方案1
0 2018-02-28 05:16:26

解决方案2
0 2018-02-28 05:22:01

Python / Itertools：按名称获取最新文件

问题描述

2 个解决方案

解决方案1 0 2018-02-28 05:16:26

解决方案2 0 2018-02-28 05:22:01

解决方案1
0 2018-02-28 05:16:26

解决方案2
0 2018-02-28 05:22:01