使用字典和转义字符时奇怪的 Python 行为

Question

我是 Python 新手，我正在尝试像以前那样执行简单的任务，但是我遇到了一个有趣的...功能？

下面的代码就像我想要的那样工作：

def cleanLDAP(search):
  escChars = {'(':r'\28', ')':r'\29' }
  for ch, val in escChars.items():
    if ch in search:
      search = search.replace(ch, val)
  return search

cleanLDAP('(123)')

正如我所料，输出是'\\\\28123\\\\29' ，但是当我按如下方式更改escChars时：

escChars = {'(':r'\28', ')':r'\29', '\\': '\5c' }

输出变得'\\x05c28123\\x05c29' ： '\\x05c28123\\x05c29'

我知道我可能会错过一些隐式编码更改，但我仍然想知道发生这种情况的原因？ 先感谢您！

Answer 1

utf-8 5c是\\ 。

当您尝试保存一个字符串作为\\5c的Python返回utf-8十六进制为5c因为你前缀字符串\\这会导致你的价值，成为： \\x05c 。

'\5c'
#'\x05c'

'5c'
#'5c'

escChars
#{'(': '\\28', ')': '\\29', '\\': '\x05c'}

当您迭代您的密钥时，它在您的迭代中测试的ch是\\ ，因为您没有使用raw格式字符串r保存您的密钥。

for ch, value in escChars.items(): 
    print(ch, value)

#( \28
#) \29
#\ c

最后，由于您在迭代期间每次找到匹配项时都在修改您的内容，因此您正在通过replace()添加它后检查\\存在

这会导致你做你的第一个替换，然后替换\\你插入与字符串utf-8的符号\\ 。

这里的简单修复是用r保存您的密钥，以确保代码仅匹配\\\\而不是\\ ，并使用相同的值保存您的值以确保它不会被转换为十六进制。

def cleanLDAP(search):
    escChars = {'(':r'\28', ')':r'\29', r'\\': r'\5c' }
    for ch, val in escChars.items():
        if ch in search:
            search = search.replace(ch, val)
    return search

>>> cleanLDAP('(123)')

#'\\28123\\29'

Answer 2

改成 -

escChars = {'(':r'\28', ')':r'\29', '\\': r'\5c' }

你错过了添加r'\\5c'而只是做了'\\5c' 。 这使它成为十六进制。

举个例子来理解——

a='\5'
a
ord(a)

分别返回'\\x05'和5

使用字典和转义字符时奇怪的 Python 行为

问题描述

2 个解决方案

解决方案1
1 已采纳 2020-09-17 07:18:06

解决方案2
0 2020-09-17 07:20:17

使用字典和转义字符时奇怪的 Python 行为

问题描述

2 个解决方案

解决方案1 1 已采纳 2020-09-17 07:18:06

解决方案2 0 2020-09-17 07:20:17

解决方案1
1 已采纳 2020-09-17 07:18:06

解决方案2
0 2020-09-17 07:20:17