以編程方式將長十六進制轉換為Unicode字符（如表情符號）

Question

給定一個包含表情符號字符的十六進制值作為str的變量（例如s = '1f602' ），如何以編程方式將其作為UTF-8編碼的表情符號字符打印到文件中？

這個問題不是通過編程方式完成的，而是要求代碼點本身包含在源代碼中。

我知道這僅適用於Python 3 ：

import codecs
s = '1f602'
with codecs.open('test.out', 'w', 'utf-8') as outfile:
    outfile.write('{}\n'.format(eval('u"{}{}"'.format(r'\U000', text))))

在受支持的文本編輯器中打開文件后，該文件將顯示一個表情符號字符。

如何在沒有eval情況下在Python 2中也能使它工作？

我以為unichr可以工作，但是它只接受小於0x10000 unicode字符。

Answer 1

您也可以通過UTF-32編碼：

import struct

def fullchr(n):
    return struct.pack('<I', n).decode('utf-32le')

outfile.write(fullchr(0x1F602))   # int('1F602', 16)

或者從Python 3.3開始，不再有狹窄的構建這樣的事情，因此您可以只使用chr(0x1F602) 。

Answer 2

這適用於Python 2和3。它使用更安全的ast.literal_eval來構建字符，因為如您ast.literal_eval ， unichr在狹窄的Python 2構建中不適用於U + FFFF以上的字符。

import ast
import io

s = '1f602'
s2 = "u'\\U{:08X}'".format(int(s,16))
c = ast.literal_eval(s2)
with io.open('test.txt','w',encoding='utf8') as f:
    f.write(c)

以編程方式將長十六進制轉換為Unicode字符（如表情符號）

問題描述

2 個解決方案

解決方案1
5 已采納 2018-02-01 21:37:53

解決方案2
0 2018-02-01 17:22:36

以編程方式將長十六進制轉換為Unicode字符（如表情符號）

問題描述

2 個解決方案

解決方案1 5 已采納 2018-02-01 21:37:53

解決方案2 0 2018-02-01 17:22:36

解決方案1
5 已采納 2018-02-01 21:37:53

解決方案2
0 2018-02-01 17:22:36