簡體   English   中英

如何在tcl中檢查並替換非UTF-8字符?

[英]How to check for and replace non UTF-8 characters in tcl?

搜索給定字符串是否在tcl中包含非UTF-8字符的最佳方法是什么? 正則表達式"^[\\x00-\\x7f]+$"是前進的唯一方法嗎?

我正在嘗試編寫tcl proc,以檢查給定變量是否包含非UTF-8字符,以及是否確實將其替換為“不支持”

Tcl的所有字符都是Unicode字符。

好的,那沒有幫助。 實際上似乎在詢問非ASCII字符。 假設您要用?替換每個非ASCII字符? ,您可以使用正則表達式替換,如下所示:

regsub -all {[\u0080-\uffff]} $inputString "?" outputString

這里的關鍵是RE放在花括號中(實際上始終強烈建議使用 ),並且我們正在使用\\uXXXX轉義序列(RE引擎也可以理解)。 那會放很多? 可能會出現,但我確定您可以調整。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM