Python requests.get 失败并显示 403 禁止，即使在使用标头和 Session object

Question

我正在发出 GET 请求以获取 JSON，这在任何设备上的任何浏览器中都可以正常工作，但不是 python 请求：

url = 'https://angel.co/autocomplete/new_tags'                         
params = {'query': 'sci', 'tag_type': 'MarketTag'}
resp = requests.get(url,params=params)
resp.raise_for_status()

给出HTTPError: 403 Client Error: Forbidden for url: https://angel.co/autocomplete/new_tags?query=ab&tag_type=MarketTag

所以我尝试了：

Python 个请求。 403 Forbidden - 我不仅尝试在标头中使用 User-Agent，而且还尝试在 firefox 的Request Headers部分中找到的所有其他标头以获取 JSON 响应，但仍然是 403！
Python 请求 - 403 禁止 - 尽管设置了 `User-Agent` 标头- 通过 Session object 发出请求，我仍然得到 403！

可能的原因是什么？ 还有什么我可以尝试使用的吗？

编辑：我在headers属性中使用的请求标头（在 firefox 中检查 JSON 的标头部分）：

{'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language':  'en-US,en;q=0.5',
'Connection': 'keep-alive',
'Host': 'angel.co',
'If-None-Match: 'W/"5857a9eac987138be074e7bdd4537df8"',
'TE': 'Trailers',
'Upgrade-Insecure-Requests': 1,
'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:71.0) Gecko/20100101 Firefox/71.0'}

Answer 1

如果 get 请求返回 403 Forbidden，即使在将 user-agent 添加到标头之后，您可能需要添加更多标头，如下所示：

    headers = {
        'user-agent':"Mozilla/5.0 ...",
        'accept': '"text/html,application...',
        'referer': 'https://...',
    }
    r = requests.get(url, headers=headers)

在 chrome 中，请求标头可以在开发人员工具的网络 > 标头 > 请求标头中找到。 （按 F12 切换它。）

Answer 2

我假设您的网站检测到请求不是从浏览器发送的（使用 javascript）。

我最近遇到了类似的问题，这个答案对我有用。

Python requests.get 失败并显示 403 禁止，即使在使用标头和 Session object

问题描述

2 个解决方案

解决方案1
0 2021-08-21 10:01:27

解决方案2
0 2023-01-29 14:17:13

Python requests.get 失败并显示 403 禁止，即使在使用标头和 Session object

问题描述

2 个解决方案

解决方案1 0 2021-08-21 10:01:27

解决方案2 0 2023-01-29 14:17:13

解决方案1
0 2021-08-21 10:01:27

解决方案2
0 2023-01-29 14:17:13