在 Python 请求缓存中将响应存储为 json

Question

我正在使用请求缓存以人类可读的格式缓存 http 响应。 我已经使用filesystem后端修补了requests ，并将序列化器修补为json ，如下所示：

import requests_cache
requests_cache.install_cache('example_cache', backend='filesystem', serializer='json')

响应确实缓存为 json，但响应的正文已编码（我猜使用cattrs库，如此处所述）。

有没有办法让requests-cache按原样保存响应？

Answer 1

你想做的事情是有道理的，但它比看起来要复杂一些。 您看到的响应文件是requests.Response对象的表示。 Response._content包含从服务器接收到的原始字节。 然后，诸如Response.json()和Response.text之类的包装器方法和属性将尝试解码该内容。 要使Response object 正常工作，它需要具有原始二进制响应主体。

当请求缓存将该响应序列化为 JSON 时，二进制内容以 Base85 编码。 这就是为什么您在那里看到编码字节而不是 JSON 的原因。 要将包括响应主体在内的所有内容保存在 JSON 中，有几个选项：

选项1

制作自定义序列化程序。 如果您希望能够修改响应内容并将这些更改反映在请求缓存返回的响应中，这可能是最好的方法。

这可能会变得有点复杂，因为您必须：

处理无效的响应内容 JSON，并另存为编码字节
在反序列化过程中，如果内容保存为 JSON，将其转换回字节以重新创建原始Response object

不过，这是可行的。 如果需要，我可以稍后尝试提出一个例子。

选项 2

制作自定义后端。 它可以扩展FileCache和FileDict ，并将有效的 JSON 内容复制到一个单独的文件中。 这是一个工作示例：

import json
from os.path import splitext

from requests import Response
from requests_cache import CachedSession, FileCache, FileDict


class JSONFileCache(FileCache):
    """Filesystem backend that copies JSON-formatted response content into a separate file
    alongside the main response file
    """
    def __init__(self, cache_name, **kwargs):
        super().__init__(cache_name, **kwargs)
        self.responses = JSONFileDict(cache_name, **kwargs)



class JSONFileDict(FileDict):
    def __setitem__(self, key: str, value: Response):
        super().__setitem__(key, value)
        response_path = splitext(self._path(key))[0]
        json_path = f'{response_path}_content.json'

        # Will handle errors and skip writing if content can't be decoded as JSON
        with self._try_io(ignore_errors=True):
            content = json.dumps(value.json(), indent=2)
            with open(json_path, mode='w') as f:
                f.write(content)

使用示例：

custom_backend = JSONFileCache('example_cache', serializer='json')
session = CachedSession(backend=custom_backend)
session.get('https://httpbin.org/get')

发出请求后，您将看到一对文件，例如：

example_cache/680f2a52944ee079.json
example_cache/680f2a52944ee079_content.json

这可能不是你想要的，但如果你只需要阅读响应内容而不需要修改它，这是最简单的选择。

在 Python 请求缓存中将响应存储为 json

问题描述

1 个解决方案

解决方案1
1 已采纳 2022-04-07 01:00:59

选项1

选项 2

在 Python 请求缓存中将响应存储为 json

问题描述

1 个解决方案

解决方案1 1 已采纳 2022-04-07 01:00:59

选项1

选项 2

解决方案1
1 已采纳 2022-04-07 01:00:59