[英]How to not display non-printable caracters with wget output?
我正在制作一个bash脚本来检索一些html内容,命令行是:
wget http://some_url.com -q -O -output.txt -o /dev/null
但是,当页面中有图像时,wget仍会“显示”那些带有不可打印字符的图像。
有没有办法告诉wget不要显示那些不可打印的角色?
干杯
ps:事实上,我无法在“ output.txt”上执行任何grep,因为它被视为二进制文件(由于不可打印的字符)
您可以尝试使用该网址,例如: https ://www.offensive-security.com/pwbonline/icq.html
通常,HTML文档不会包含二进制数据。 我无法重现此特定问题。
如果只是要强制grep
搜索由于grep
假定它们是二进制文件而通常会跳过的文件,请使用--binary-files=text
:
wget -O- http://server.com/url | grep --binary-files=text 'foo.*bar'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.