繁体 English 中英

如何检测Java中的字符集编码？

[英]How to detect which character set encoding in Java?

原文 2010-02-12 00:03:51 6 2 java/ character-encoding

有人知道是否有一种简单的方法来检测Java中的字符集编码？ 在我看来，某些程序能够检测给定数据使用哪个字符集，或至少进行近似。

我认为底层机制必须解码每个字符集中的数据并选择具有最少未定义字符的那个，然后是哪个字符集更常见以打破平局。

有任何想法吗？

2 个解决方案

看看jchardet ，一个从Mozilla浏览器移植的库，专门用于“猜测”文档的字符集。

作为替代方案， cpdetector库更新一点，专门用于检测文档的代码页。

为了查找数据是否为任何unicode格式（UTF-8，UTF-16等），您可以读取字节流中的数据并检查前4个字节（BOM大小），并且对于每个编码，它将是不同的

例如：

对于UTF-8，前3个字节将是EF，BB，BF

对于unicode编码以外的编码，我不确定......

如何检测文件的字符编码？

[英]How to detect the character encoding of a file?

Java中的自动检测字符编码

[英]Auto-Detect Character Encoding in Java

如何在Java Web应用程序中全局设置字符编码和内容类型？

[英]How to set Character Encoding and Content Type globally in a Java web app?

如何设置PDFBox的字符编码

[英]How to set character encoding for PDFBox

如何在BeanIO中设置字符编码？

[英]How to set character encoding in BeanIO?

如何检测Unix终端字符编码？

[英]How to detect Unix terminal character encoding?

检测哪个字符与特定编码不同的最快方法

[英]Fastest way to detect which character is different than a specific encoding

Java：检测给定字符编码的不可显示字符

[英]Java: Detect non-displayable chars for a given Character Encoding

如何在SOAP请求中设置字符编码

[英]How to set character encoding in SOAP request

如何在HttpServlet，HttpServletRequest中设置默认字符编码？

[英]How to set default character encoding in an HttpServlet, HttpServletRequest?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何检测文件的字符编码？ Java中的自动检测字符编码如何在Java Web应用程序中全局设置字符编码和内容类型？如何设置PDFBox的字符编码如何在BeanIO中设置字符编码？如何检测Unix终端字符编码？检测哪个字符与特定编码不同的最快方法 Java：检测给定字符编码的不可显示字符如何在SOAP请求中设置字符编码如何在HttpServlet，HttpServletRequest中设置默认字符编码？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM