[英]How do I remove all non-ASCII characters with regex and Notepad++?
我搜索了很多,但沒有寫到如何從 Notepad++ 中刪除非 ASCII 字符。
我需要知道在查找和替換中要寫什么命令(有圖片會很棒)。
如果我想創建一個白名單並為所有 ASCII 單詞/行添加書簽,那么非 ASCII 行將不被標記
如果文件很大並且無法選擇所有 ASCII 行,而只想選擇包含非 ASCII 字符的行...
除了 ProGM 的回答之外,如果您在 NUL 或 ACK 等框中看到字符並想要擺脫它們,這些是 ASCII 控制字符(0 到 31),您可以使用以下表達式找到它們並將它們刪除:
[\x00-\x1F]+
為了刪除所有非 ASCII AND ASCII 控制字符,您應該刪除與此正則表達式匹配的所有字符:
[^\x1F-\x7F]+
要保留新行:
下一個:
現在,選擇替換選項擴展並用\n替換#
:) 現在,你有一個干凈的 ASCII 文件;)
另一個好技巧是在你的編輯器中進入 UTF8 模式,這樣你就可以真正看到這些有趣的字符並自己刪除它們。
另一種方式...
如果您不記得正則表達式或不想查找它,這很好。 但是其他人提到的正則表達式也是一個很好的解決方案。
單擊查看/顯示符號/顯示所有字符 - 顯示文件中的 [SOH] 字符 單擊文件中的 [SOH] 符號 CTRL=H 調出替換 保留“查找內容:”原樣 更改'替換為:'到您選擇的字符(逗號,分號,其他......)點擊'全部替換'完成並完成!
因為我無法評論。 除了史蒂芬溫克勒:
[\x00-\x08\x0B-\x0C\x0E-\x1F]+
忽略 \r \n AND \t (回車、換行、制表符)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.