[英]How do I determine a word boundary in Unicode stream in C#?
我正在讀取Unicode流,而不希望不必通過正則表達式傳遞整個字符串。 我可以使用一個簡單(可靠)的字符來打斷各種語言中的單詞嗎?
我的字節數組可能會基於UTF-16或UTF-8
如果使用Java,則可以使用BreakIterator 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.