从DataOutputStream.writeUTF（）读取时如何获取Java字符串的“原始”字节？

Question

目前，我正在使用DataInput / OutputStream在网络上传输字符串。 我要传输的字符串需要转换为字节数组，然后才能解密。

但是，由于使用DataOutputStream.writeUTF（“ foobar”）编写字符串时，其字节数组包含已编码的Java修改的UTF-8数据，从而使加密过程变得更加繁琐。

如何从Java修改的UTF-8字符串中获取原始字节？

Answer 1

Unicode有多种变体，其中s-with- ^可以是一个字符或两个字符：s加combining- ^。 Java有一个Normalizer类可以转换为一个特定的变体。 请参阅http://docs.oracle.com/javase/tutorial/i18n/text/normalizerapi.html或立即查看API。

这要求原始字符串遵循一种变体。 一个人不能取字节，然后将其解释为UTF-8，因为存在非法序列。 这样做是为了防止在字节序列中间出现错误的字节/字符。

String normalizedString = Normalizer.normalize(s, Normalizer.Form.NFD);

Answer 2

如果您使用http://docs.oracle.com/javase/1.4.2/docs/api/java/io/DataOutputStream.html#write（byte [ ]，int，int）

从DataOutputStream.writeUTF（）读取时如何获取Java字符串的“原始”字节？

问题描述

2 个解决方案

解决方案1
0 已采纳 2011-12-27 05:08:57

解决方案2
0 2011-12-27 05:52:22

从DataOutputStream.writeUTF（）读取时如何获取Java字符串的“原始”字节？

问题描述

2 个解决方案

解决方案1 0 已采纳 2011-12-27 05:08:57

解决方案2 0 2011-12-27 05:52:22

解决方案1
0 已采纳 2011-12-27 05:08:57

解决方案2
0 2011-12-27 05:52:22