[英]Using sed to edit html
在 Linux 中,執行以下命令下載“第一個星期一”文章:
wget -O first_monday.html http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/3156/2747
使用 sed 和正則表達式編輯 first_monday.html 如下:
刪除空/空白段落(如果有)。 (HTML 段落開始標記是<p>
結束標記是</p>
)
<p>This is some text in a paragraph.</p>
如果在<p>
和</p>
之間沒有任何內容或只有空格或制表符,則該段落為空
刪除所有圖像(在 HTML 中,圖像是用<img>
標簽定義的。示例:
<img src="html5.gif" alt="The official HTML5 Icon">
生成的文件仍應是有效的 HTML 文件,可在標准 Web 瀏覽器中顯示。 對於您的答案,請復制/粘貼您用於回答此問題的命令。 例如,如果您使用了類似於
sed -iback -e 's|<p>[[:space:]]*</p>||g' first_monday.html
然后您將粘貼該命令以及您在該字段的答案中使用的任何其他命令。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.