繁体   English   中英

如何不显示带有wget输出的不可打印角色?

[英]How to not display non-printable caracters with wget output?

我正在制作一个bash脚本来检索一些html内容,命令行是:

wget http://some_url.com -q -O -output.txt -o /dev/null

但是,当页面中有图像时,wget仍会“显示”那些带有不可打印字符的图像。

有没有办法告诉wget不要显示那些不可打印的角色?

干杯

ps:事实上,我无法在“ output.txt”上执行任何grep,因为它被视为二进制文件(由于不可打印的字符)

您可以尝试使用该网址,例如: https ://www.offensive-security.com/pwbonline/icq.html

通常,HTML文档不会包含二进制数据。 我无法重现此特定问题。

如果只是要强制grep搜索由于grep假定它们是二进制文件而通常会跳过的文件,请使用--binary-files=text

wget -O- http://server.com/url | grep --binary-files=text 'foo.*bar'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM