
[英]When text copied from MS Word is sent to Java via HTML form, strange characters appear and text length increases
[英]Strange characters when pasted from Word in our Java app
从Word粘贴到其文本字段之一时,我们有一个Java应用程序遇到字符编码问题。 这仅在IE8中发生,并且我假定以前的IE版本。 我最初为解决此问题而添加的replaceAll Java过滤器可在所有最新的浏览器上使用。 IE8是问题所在。
问题的一个示例:
将“双引号”从Word粘贴到文本字段中。 保存条目后,引号将转换为以下字符。 每次新保存后,字符都会更改,并且字符数会增加。
首次保存:“双引号”
第二次保存:¢–双引号¢
第三次保存:â¡
第四次保存:ÃÃ,¢¢,ƒ、、、、、、、、、、、、、、、、 – –双引号、、、、、、、、、、、、、、、
因此,引号和撇号是我们的主要关注点。 我们还希望项目符号列表在此文本字段中运作良好。
Microsoft Word不使用标准的双引号(“),它们使用的双引号会更改其“方向”,如下所示:“”。格式化的双引号与普通的双引号有很大不同,并且当出现双引号时放在一个普通的文本框中。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.