簡體   English   中英

使用 sed 編輯 html

[英]Using sed to edit html

在 Linux 中,執行以下命令下載“第一個星期一”文章:

wget -O first_monday.html http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/3156/2747

使用 sed 和正則表達式編輯 first_monday.html 如下:

刪除空/空白段落(如果有)。 (HTML 段落開始標記是<p>結束標記是</p>

<p>This is some text in a paragraph.</p>

如果在<p></p>之間沒有任何內容或只有空格或制表符,則該段落為空

刪除所有圖像(在 HTML 中,圖像是用<img>標簽定義的。示例:

<img src="html5.gif" alt="The official HTML5 Icon">   

生成的文件仍應是有效的 HTML 文件,可在標准 Web 瀏覽器中顯示。 對於您的答案,請復制/粘貼您用於回答此問題的命令。 例如,如果您使用了類似於

sed -iback -e 's|<p>[[:space:]]*</p>||g' first_monday.html

然后您將粘貼該命令以及您在該字段的答案中使用的任何其他命令。

首先,您可以使用以下命令刪除空段落標簽

sed -i 's|<p>[[:space:]]*</p>||g' first_monday.html

接下來,您的圖像標簽也可以使用命令以相同的方式刪除,如下所示;

sed -i 's|<img /*>||g' first_monday.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM