簡體   English   中英

如何用英文字符替換非英文字符

[英]How to replace a non English character with English character

我有一個奇怪的問題。 我從 Google Cloud Vision 獲取包含非英文字符的文本,但它們實際上是英文字符。 這是谷歌雲視覺OCR的一個錯誤。

我得到一個這樣的角色: Héllo

Notice that é is non English character.

我想轉換成simple "Hello" ,這樣我就可以處理這個詞了。

我不是在尋找編程答案。 我只是在尋找方法來做到這一點。

任何提示都會有用。

謝謝!

如果 Apache Commons 適合您,您可以使用他們的 StringUtils 庫。 stripAccents方法應該適合您的需要。 從源代碼中您可以看到它實際上使用了java.text.Normalizer ,因此您也可以查看它。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM