如何在Python中正确比较psycopg2中的unicode字符串？

Question

我在比较从PostgreSQL数据库获得的UTF-8字符串时遇到问题：

>>> db_conn = psycopg2.connect("dbname='foo' user='foo' host='localhost' password='xxx'")
>>> db_cursor = db_conn.cursor()
>>> sql_com = ("""SELECT my_text FROM table WHERE id = 1""")
>>> db_cursor.execute(sql_com)
>>> sql_result = db_cursor.fetchone()
>>> db_conn.commit()
>>> db_conn.close()
>>> a = sql_result[0]
>>> a
u'M\xfcnchen'
>>> type(a)
<type 'unicode'>
>>> print a
München
>>> b = u'München'
>>> type(b)
<type 'unicode'>
>>> print b
MÃ¼nchen
>>> a == b
False

我真的很困惑，为什么会这样，我可以告诉我如何将字符串与数据库中的变音符号与另一个字符串进行比较，所以比较是真的？ 我的数据库是UTF8：

postgres@localhost:$ psql -l
        List of databases
   Name    |  Owner   | Encoding 
-----------+----------+----------
 foo       | foo      | UTF8

Answer 1

这显然是控制台区域设置的问题。

u"München"是u'M\\xfcnchen'在Unicode和'M\\xc3\\xbcnchen'在UTF-8。 后者是你的MÃ¼nchen如果被视为ISO8859-1或CP1252。

Psycopg2似乎为您提供了正确的Unicode值。

Answer 2

如果你输入

b = 'München'

你从类型（b）得到什么？

也许您不需要将字符串逐字转换为unicode文本，因为Python会自动记录这一点。

编辑：我从我的python CLI得到这个：

>>> b = u'München'
>>> b
u'M\xfcnchen'
>>> print b
München

虽然您以不同的编码获得打印结果

如何在Python中正确比较psycopg2中的unicode字符串？

问题描述

2 个解决方案

解决方案1
3 2011-01-19 18:31:36

解决方案2
1 2011-01-19 17:47:03

如何在Python中正确比较psycopg2中的unicode字符串？

问题描述

2 个解决方案

解决方案1 3 2011-01-19 18:31:36

解决方案2 1 2011-01-19 17:47:03

解决方案1
3 2011-01-19 18:31:36

解决方案2
1 2011-01-19 17:47:03