使用正则表达式使用notepad ++搜索和替换html文件中的文本

Question

我们正在尝试在使用 Notepad++ 打开的 html 文件中搜索和替换文本。

我们需要更新标签“a href”和“img src”内的路径，维护文件的名称（文件中的文件名和路径不同）

所以我们需要找到所有这些行：

 <a href="File://///name.it.domain.com/PATH/file name.extension"
 <img src="PATH/file name.extension"

并将 PATH/ 更改为 images/，对于任何 PATH，保持文件名：

<a href="images/file name.extension"
<img src="images/file name.extension"

这里有一些例子：

<a href="File://///name.it.domain.com/directory/name/this is a butterfly.pdf"应该改为<a href="images/this is a butterfly.pdf"

和

<a href="C:/party/koala/main.doc"应该改为<a href="images/main.doc"

<img src="it.free.main/doll/hello.jpg"应该改为<img src="images/hello.jpg"

文件中的路径具有共同的起始表达式，例如（File://///name.it.domain.com 或 C:/ 等）所以我正在尝试使用表达式file:.{number}(.*)在查找哪个字段并在替换字段$1/images中它可以工作，但它不是最佳解决方案，因为我必须在每个文件中主要更改它，任何人都可以帮助我们找到更通用的解决方案？

Answer 1

实现此目的的一种方法是查找最后一次出现的反斜杠字符，因为您的示例表明可以依赖至少一次的存在。

find正则表达式：

(href|src)=".*\\(.*)"

replace正则表达式：

$1="images\\$2"

您可以在此处通过您提供的示例看到这一点。

Answer 2

Ctrl + H
查找什么： (?:href|src)="\K[^"]+(?=/[^/."]+\.[^/."]+)
替换为： images
UNTICK火柴盒
TICK环绕
SELECT正则表达式
打勾. matches newline . matches newline
全部替换

解释：

(?:             # non capture group
    href            # literally
  |               # OR
    src             # literally
)               # end group
="              # literally
\K              # forget all we have seen until this position
[^"]+           # 1 or more any character that is not a double quote
(?=             # positive lookahead, make sure we have after:
    /               # a slash
    [^/."]+         # 1 or more any character that is not slash, dot or quote
    \.              # a dot
    [^/."]+         # 1 or more any character that is not slash, dot or quote
)               # end lookahead

截图（之前）：

截图（之后）：

使用正则表达式使用notepad ++搜索和替换html文件中的文本

问题描述

2 个解决方案

解决方案1
0 2022-08-10 23:27:30

解决方案2
0 2022-08-12 09:31:06

使用正则表达式使用notepad ++搜索和替换html文件中的文本

问题描述

2 个解决方案

解决方案1 0 2022-08-10 23:27:30

解决方案2 0 2022-08-12 09:31:06

解决方案1
0 2022-08-10 23:27:30

解决方案2
0 2022-08-12 09:31:06