查找並替換為記事本++

Question

我有一個從PDF轉換為HTML的文檔，可在公司網站上使用，以供參考和索引以進行搜索。 我正在嘗試格式化轉換后的文檔以滿足我的需要，在此過程中，我試圖清理從PDF時提取的一些垃圾，例如頁碼，頁眉和頁腳。 幸運的是，所有這些需要刪除的行都是4行的塊，不幸的是它們並不完全相同，因此無法通過簡單的文字替換將其刪除。 這些行包含與頁面相關的遞增數字。 如何從HTML文件中刪除以下示例。

Title<br>
10<br>
<hr>
<A name=11></a>Footer<br>

我已經嘗試過許多不同的正則表達式嘗試，但是由於我在該領域的技能有限，所以找不到合適的語法。 我確定我缺少一些相當容易的東西，因為看來我所需要的只是用通配符替換代碼中的兩個數字，其余的都是文字。

任何幫助表示贊賞

Answer 1

npp的搜索和替換非常奇怪。 我找不到帶有正則表達式的換行符，盡管文檔說：

從v4.9開始，簡單查找/替換（control + h）已更改，允許在正則表達式模式和擴展模式下使用\\ r \\ n和\\ t。

我更新到了最新版本，但是它不起作用。 使用擴展模式可以查找換行符，但無法指定通配符。

但是，您可以使用宏來克服此問題。

准備搜索以查找唯一段落（例如Title<br>\\r\\n ，在這里您可以使用擴展模式）
開始錄制宏
按F3使用您的搜索
標記四行並刪除它們
停止錄制宏...完成！

只需重播它，它就會刪除您想要刪除的內容。

Answer 2

如果我正確理解了您的請求，則此模式與您的字符串匹配：

Title<br>( ?)\n([0-9]+)<br>( ?)\n<hr>( ?)\n<A name=([0-9]+)></a>Footer<br>

我使用Regex Coach嘗試復雜的regex模式。 其他實用程序也可用。

編輯

由於我不使用Notepad ++，因此無法確定該模式是否適合您。 很抱歉，如果確實如此。 （我本人是一個TextPad男人，它確實可以使用該工具）。

查找並替換為記事本++

問題描述

2 個解決方案

解決方案1
1 已采納 2010-06-11 12:05:17

解決方案2
0 2010-06-11 12:04:34

查找並替換為記事本++

問題描述

2 個解決方案

解決方案1 1 已采納 2010-06-11 12:05:17

解決方案2 0 2010-06-11 12:04:34

解決方案1
1 已采納 2010-06-11 12:05:17

解決方案2
0 2010-06-11 12:04:34