繁体   English   中英

如何从java / groovy中的网页从ISO-8859-1转换为UTF-8

[英]How to convert from ISO-8859-1 to UTF-8 a webpage in java/groovy

我想根据浏览器阅读ISO-8859-1字符集的网页A,然后将UTF-8中的内容作为网页B的内容返回。

这是:我想以用于显示页面B其余部分的同一字符集显示页面A的内容,即UTF-8。

如何在java / groovy中做到这一点?

提前致谢

在Groovy中,您可以编写如下内容:

def source = new URL("http://www.google.com").getText("ISO-8859-1")
def target = new String(source.getBytes("UTF-8"), "UTF-8")

您没有说要建立什么堆栈或如何访问内容,但是这种转码操作的一般机制是使用UTF-16作为中介。 也就是说,将ISO-8859-1字节转换为UTF-16字符,再转换为UTF-8字节。

您可以使用InputStreamReader (带有ISO-8859-1 Charset ),然后通过OutputStreamWriter (带有UTF-8 Charset )写入字节。

一些API提供编码操作作为其I / O类的一部分(例如ServletResponse.getWriter() )。

我忽略了解析和转换数据的任何需求,这是蠕虫的另一种形式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM