![](/img/trans.png)
[英]Replace non english character in a string with utf-8 character in Android / Java
[英]How to replace a non English character with English character
我有一個奇怪的問題。 我從 Google Cloud Vision 獲取包含非英文字符的文本,但它們實際上是英文字符。 這是谷歌雲視覺OCR的一個錯誤。
我得到一個這樣的角色: Héllo
Notice that é is non English character.
我想轉換成simple "Hello"
,這樣我就可以處理這個詞了。
我不是在尋找編程答案。 我只是在尋找方法來做到這一點。
任何提示都會有用。
謝謝!
如果 Apache Commons 適合您,您可以使用他們的 StringUtils 庫。 stripAccents
方法應該適合您的需要。 從源代碼中您可以看到它實際上使用了java.text.Normalizer
,因此您也可以查看它。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.