在Python中打印所有unicode字符

Question

我已经编写了一些代码来创建十六进制系统的所有4位数组合，现在我正在尝试使用它来打印出与这些值相关联的所有unicode字符。 这是我用来执行此操作的代码：

char_list =["0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"]
pairs = []
all_chars = []

# Construct pairs list
for char1 in char_list:
    for char2 in char_list:
        pairs.append(char1 + char2)

# Create every combination of unicode characters ever
    for pair1 in pairs:
        for pair2 in pairs:
            all_chars.append(pair1 + pair2)

# Print all characters
for code in all_chars:
    expression = "u'\u" + code + "'"
    print "{}: {}".format(code,eval(expression))

以下是我收到的错误消息：

Traceback (most recent call last): File "C:\Users\andr7495\Desktop\unifun.py", 
line 18, in <module> print "{}: {}".format(code,eval(expression))
UnicodeEncodeError: 'ascii' codec can't encode character u'\x80' in position 0: 
ordinal not in range(128)

当代码尝试打印u“\\ u0080”时抛出异常，但是，我可以在交互式解释器中执行此操作而不会出现问题。

我已经尝试将结果转换为unicode并指定忽略错误，但它没有帮助。 我觉得我缺少对unicode如何工作的基本理解，但是我能做些什么来让我的代码打印出所有有效的unicode表达式？

Answer 1

import sys
for i in xrange(sys.maxunicode): 
  print unichr(i);

Answer 2

这可能是您的终端出现问题（cmd.exe在这方面非常糟糕），因为大多数情况下，当您“打印”您正在打印到终端并最终尝试进行编码时...如果您运行代码在空闲或其他可以渲染unicode的空间中，您应该看到字符。 你不应该使用eval试试这个

for uni_code in range(...):
    print hex(uni_code),unichr(uni_code)

Answer 3

您正在尝试将Unicode字符格式化为字节字符串。 您可以使用Unicode字符串来删除错误：

print u"{}: {}".format(code,eval(expression))
      ^

其他答案更能简化原始问题，但是你肯定是在艰难地做事。

Answer 4

以下是本文中重写的示例，它将列表保存到文件中。

Python 3.x：

import sys 
txtfile = "unicode_table.txt"
print("creating file: " + txtfile) 
F = open(txtfile, "w", encoding="utf-16", errors='ignore')
for uc in range(sys.maxunicode):
    line = "%s %s" % (hex(uc), chr(uc))
    print(line, file=F)
F.close()

在Python中打印所有unicode字符

问题描述

4 个解决方案

解决方案1
13 2015-10-09 16:41:30

解决方案2
0 2015-10-09 16:38:54

解决方案3
0 已采纳 2015-10-09 17:29:16

解决方案4
0 2017-06-09 12:04:07

在Python中打印所有unicode字符

问题描述

4 个解决方案

解决方案1 13 2015-10-09 16:41:30

解决方案2 0 2015-10-09 16:38:54

解决方案3 0 已采纳 2015-10-09 17:29:16

解决方案4 0 2017-06-09 12:04:07

解决方案1
13 2015-10-09 16:41:30

解决方案2
0 2015-10-09 16:38:54

解决方案3
0 已采纳 2015-10-09 17:29:16

解决方案4
0 2017-06-09 12:04:07