簡體   English   中英

如何不顯示帶有wget輸出的不可打印角色?

[英]How to not display non-printable caracters with wget output?

我正在制作一個bash腳本來檢索一些html內容,命令行是:

wget http://some_url.com -q -O -output.txt -o /dev/null

但是,當頁面中有圖像時,wget仍會“顯示”那些帶有不可打印字符的圖像。

有沒有辦法告訴wget不要顯示那些不可打印的角色?

干杯

ps:事實上,我無法在“ output.txt”上執行任何grep,因為它被視為二進制文件(由於不可打印的字符)

您可以嘗試使用該網址,例如: https ://www.offensive-security.com/pwbonline/icq.html

通常,HTML文檔不會包含二進制數據。 我無法重現此特定問題。

如果只是要強制grep搜索由於grep假定它們是二進制文件而通常會跳過的文件,請使用--binary-files=text

wget -O- http://server.com/url | grep --binary-files=text 'foo.*bar'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM