如何在Python中缓存/存储对象？

Question

我有一些实例化非常慢的对象。 它们代表从外部来源（例如YAML文件）加载的数据，而加载大型YAML文件的速度很慢（我不知道为什么）。

我知道这些对象取决于一些外部因素：

创建对象时传递的参数
环境变量
一些外部文件

理想情况下，如果外部因素相同，我希望使用透明的非样板方法来缓存这些对象：

@cache(depfiles=('foo',), depvars=(os.environ['FOO'],))
class Foo():
    def __init__(*args, **kwargs):
        with open('foo') as fd:
           self.foo = fd.read()
        self.FOO = os.environ['FOO']
        self.args = args
        self.kwargs = kwargs

主要思想是，第一次实例化Foo ，将使用对象的内容创建一个缓存文件，然后在下次实例化（在另一个Python会话中）时，仅当没有依赖项时才使用该缓存文件。和论点已经改变。

到目前为止，我发现的解决方案是基于shelve ：

import shelve

class Foo(object):
    _cached = False
    def __new__(cls, *args, **kwargs):
        cache = shelve.open('cache')
        cache_foo = cache.get(cls.__name__)
        if isinstance(cache_foo, Foo):
            cache_foo._cached = True
            return cache_foo
        self = super(Foo, cls).__new__(cls, *args, **kwargs)
        return self

    def __init__(self, *args, **kwargs):
        if self._cached:
            return

        time.sleep(2) # Lots of work
        self.answer = 42

        cache = shelve.open('cache')
        cache[self.__class__.__name__] = self
        cache.sync()

它可以按原样完美运行，但是它太样板了，无法涵盖所有情况：

当不同的类具有相同的名称时发生冲突
检查args和kwargs
检查依赖项（环境变量，外部文件）

是否有任何本机解决方案可在Python中实现类似的行为？

Answer 1

Python 3提供了functools.lru_cache()装饰器来提供可调用对象的备注，但是我认为您是在要求保留应用程序多次运行的缓存，并且到那时为止，存在各种各样的不同要求，因此您不太可能找到一个“适合所有人”的解决方案。

如果您自己的答案对您有用，请使用它。 就“太多样板”而言，我会将缓存提取到一个单独的mixin类中：在任何情况下， __new__对Foo的第一个引用都应该是cls ，并且可以使用__qualname__属性代替cls.__name__减少类名冲突的可能性（假设Python 3.3或更高版本）。

如何在Python中缓存/存储对象？

问题描述

1 个解决方案

解决方案1
1 2017-02-15 09:07:05

如何在Python中缓存/存储对象？

问题描述

1 个解决方案

解决方案1 1 2017-02-15 09:07:05

解决方案1
1 2017-02-15 09:07:05