繁体   English   中英

如何将unicode字符串解码为unicode值

[英]How to decode unicode string to unicode value

我在Python 2.7中有一个执行以下操作的程序:

  1. 要求用户输入(非英语字符。例如希伯来语,英语)
  2. 在列表中拆分句子的每个字符。 (输入内容可以是一小段文字,也可以是一封电子邮件)
  3. 将字符转换为Unicode值。 因此,最后,列表的每个项目都是一个Unicode转义字符,例如"u/0391" ,可以将其作为字符串进行操作。

我的起步很好,但是我无法拆分数组中的字母,也无法打印正确的unicode值。

Gr_text = unicode(raw_input("Type your message below:\n"), 'unicode-escape')

Gr = Gr_text.split()

print Gr

输入示例:

Ενααπλοπαραδειγμα。

输入(翻译为“简单示例”)为希腊语,没有语调。 该句子应在列表中转换为

['\u0395', '\u03bd', '\u03b1','\u0020', '\u03b1', '\u03c0', '\u03bb', '\u03bf','\u0020', '\u03c0', '\u03b1', '\u03c1', '\u03b1', '\u03b4', '\u03b5', '\u03b9', '\u03b3', '\u03bc', '\u03b1','\u0020',]

要指出的是,我还想转换空格和特殊字符。 然后,我将列表中的每个字母都作为unicode字符串而不是简单字母来获取,因此我可以进行操作并将其赋予其他值。

我已经对此进行了测试,但对我有用,但是您的里程可能会有所不同。

import sys, locale

Gr_text = raw_input('Type your message below:\n').decode(sys.stdin.encoding or locale.getpreferredencoding(True))

Gr = Gr_text.split()

print Gr


“完全披露”信用归于https://stackoverflow.com/a/477496/1427800

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM