[英]How do I remove all non-ASCII characters with regex and Notepad++?
我搜索了很多,但没有写到如何从 Notepad++ 中删除非 ASCII 字符。
我需要知道在查找和替换中要写什么命令(有图片会很棒)。
如果我想创建一个白名单并为所有 ASCII 单词/行添加书签,那么非 ASCII 行将不被标记
如果文件很大并且无法选择所有 ASCII 行,而只想选择包含非 ASCII 字符的行...
除了 ProGM 的回答之外,如果您在 NUL 或 ACK 等框中看到字符并想要摆脱它们,这些是 ASCII 控制字符(0 到 31),您可以使用以下表达式找到它们并将它们删除:
[\x00-\x1F]+
为了删除所有非 ASCII AND ASCII 控制字符,您应该删除与此正则表达式匹配的所有字符:
[^\x1F-\x7F]+
要保留新行:
下一个:
现在,选择替换选项扩展并用\n替换#
:) 现在,你有一个干净的 ASCII 文件;)
另一个好技巧是在你的编辑器中进入 UTF8 模式,这样你就可以真正看到这些有趣的字符并自己删除它们。
另一种方式...
如果您不记得正则表达式或不想查找它,这很好。 但是其他人提到的正则表达式也是一个很好的解决方案。
单击查看/显示符号/显示所有字符 - 显示文件中的 [SOH] 字符 单击文件中的 [SOH] 符号 CTRL=H 调出替换 保留“查找内容:”原样 更改'替换为:'到您选择的字符(逗号,分号,其他......)点击'全部替换'完成并完成!
因为我无法评论。 除了史蒂芬温克勒:
[\x00-\x08\x0B-\x0C\x0E-\x1F]+
忽略 \r \n AND \t (回车、换行、制表符)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.