繁体   English   中英

使用 Sed 删除任何特殊字符

[英]Delete any special character using Sed

我还有另一个子域列表。 我想删除任何包含这些特殊字符的Wildcard子域:

()!&$#*+?

大多数情况下,数据是前缀随机的。 此外,可能是中间。 这是输出数据的一些示例

(www.imgur.com
***************diet.blogspot.com
*-1.gbc.criteo.com
------------------------------------------------------------i.imgur.com

这在浏览列表时非常不便。 与往常一样,我正在尝试 sed 来修复它:

sed -i "/[!()#$&?+]/d" foo.txt ###Didn't work
sed -i "/[\!\(\)\#\$\&\?\+]/d" ###Escaping char didn't work

执行上述命令仍会导致列表未unchanged且文件仍处于原始状态。 我在想; 解决此问题的方法是通过管道传输一系列sed命令,以便将其一一删除:

cat foo.txt | sed -e "/!/d" -e "/#/d" -e "/\*/d" -e "/\$/d" -e "/(/d" -e "/)/d" -e "/+/d" -e "/\'/d" -e "/&/d" >> foo2.txt
cat foo.txt | sed -e "/\!/d" | sed -e "/\#/d" | sed -e "/\*/d" | sed -e "/\$/d" | sed -e "/\+/d" | sed -e "/\'/d" | sed -e "/\&/d" >> foo2.txt

如果转义所有特殊字符不起作用,那一定是我的错误逻辑。 也尝试过/g仍然不会增加我的运气。

附带说明:我不希望-被删除,因为某些有效的子域可以具有-字符:

line-apps.com
line-apps-beta.com
line-apps-rc.com
line-apps-dev.com

任何帮助都会受到珍惜。

使用sed

$ sed '/[[:punct:]]/d' input_file

这应该删除所有带有特殊字符的行,但是,如果您提供示例数据会有所帮助。

最终使用@potong提到的单引号''

sed '/[\!\?\+\,\#\$\&\*\(\)\[\]\ ]/d'

不知道为什么会这样,但 shell 总是要归咎于目标。

在你的答案中做你想做的事情(在你的问题中添加[]等字符)将是:

sed '/[][!?+,#$&*() ]/d'

要不就:

grep -v '[][!?+,#$&*() ]'

根据 POSIX,要在括号表达式中包含] ,它必须是第一个字符,否则它表示括号表达式的结尾。

不过,请考虑打印您想要的行,而不是删除您不想要的行,例如:

grep '^[[:alnum:]_.-]$' file

打印仅包含字母、数字、下划线、破折号和/或句点的行。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM