繁体   English   中英

是否有处理分号的parse_qs的替代方案?

[英]Is there an alternative to parse_qs that handles semi-colons?

TL; DR

哪些库/调用可用于处理包含分号的查询字符串与parse_qs不同?

>>> urlparse.parse_qs("tagged=python;ruby")
>>> {'tagged': ['python']}

完整的背景

我正在使用StackExchange API来搜索标记的问题。

搜索的布局是这样的,标签用分号分隔:

/2.1/search?order=desc&sort=activity&tagged=python;ruby&site=stackoverflow

与API交互就好了。 当我想测试调用时,特别是当使用httpretty来模拟HTTP时,会出现问题。

在引擎盖下, httpretty正在使用python标准库中的urlparse.parse_qs来解析查询字符串。

>>> urlparse.parse_qs("tagged=python;ruby")
{'tagged': ['python']}

显然这不太好用。 这是一个小例子,这里是httpretty的一小部分(在测试环境之外)。

import requests
import httpretty

httpretty.enable()

httpretty.register_uri(httpretty.GET, "https://api.stackexchange.com/2.1/search", body='{"items":[]}')
resp = requests.get("https://api.stackexchange.com/2.1/search", params={"tagged":"python;ruby"})
httpretty_request = httpretty.last_request()
print(httpretty_request.querystring)

httpretty.disable()
httpretty.reset()

我想使用httpretty中的机制,但是需要parse_qs的解决方法。 我现在可以修补httpretty,但是很想看看还能做些什么。

为了解决这个问题,我暂时修补了httpretty.core.unquote_utf8 (技术上是httpretty.compat.unquote_utf8 )。

#
# To get around how parse_qs works (urlparse, under the hood of
# httpretty), we'll leave the semi colon quoted.
# 
# See https://github.com/gabrielfalcao/HTTPretty/issues/134
orig_unquote = httpretty.core.unquote_utf8
httpretty.core.unquote_utf8 = (lambda x: x)

# It should handle tags as a list
httpretty.register_uri(httpretty.GET,
                       "https://api.stackexchange.com/2.1/search",
                       body=param_check_callback({'tagged': 'python;dog'}))
search_questions(since=since, tags=["python", "dog"], site="pets")

...

# Back to normal for the rest
httpretty.core.unquote_utf8 = orig_unquote
# Test the test by making sure this is back to normal
assert httpretty.core.unquote_utf8("%3B") == ";"

这假设您不需要任何其他不带引号的东西。 另一个选择是只在parse_qs到达parse_qs之前保留百分比编码。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM