[英]Replace non english character in a string with utf-8 character in Android / Java
[英]How to replace a non English character with English character
我有一个奇怪的问题。 我从 Google Cloud Vision 获取包含非英文字符的文本,但它们实际上是英文字符。 这是谷歌云视觉OCR的一个错误。
我得到一个这样的角色: Héllo
Notice that é is non English character.
我想转换成simple "Hello"
,这样我就可以处理这个词了。
我不是在寻找编程答案。 我只是在寻找方法来做到这一点。
任何提示都会有用。
谢谢!
如果 Apache Commons 适合您,您可以使用他们的 StringUtils 库。 stripAccents
方法应该适合您的需要。 从源代码中您可以看到它实际上使用了java.text.Normalizer
,因此您也可以查看它。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.