[英]How to convert from ISO-8859-1 to UTF-8 a webpage in java/groovy
我想根据浏览器阅读ISO-8859-1字符集的网页A,然后将UTF-8中的内容作为网页B的内容返回。
这是:我想以用于显示页面B其余部分的同一字符集显示页面A的内容,即UTF-8。
如何在java / groovy中做到这一点?
提前致谢
在Groovy中,您可以编写如下内容:
def source = new URL("http://www.google.com").getText("ISO-8859-1")
def target = new String(source.getBytes("UTF-8"), "UTF-8")
您没有说要建立什么堆栈或如何访问内容,但是这种转码操作的一般机制是使用UTF-16作为中介。 也就是说,将ISO-8859-1字节转换为UTF-16字符,再转换为UTF-8字节。
您可以使用InputStreamReader
(带有ISO-8859-1 Charset
),然后通过OutputStreamWriter
(带有UTF-8 Charset
)写入字节。
一些API提供编码操作作为其I / O类的一部分(例如ServletResponse.getWriter()
)。
我忽略了解析和转换数据的任何需求,这是蠕虫的另一种形式。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.