簡體   English   中英

正則表達式刪除 HTML 標記中“<”和“/”之后的空格

[英]Regex to remove white spaces after `<` and `/` in HTML tag

我有這樣的文本,只想消除</字符后的空格,以避免在解析它時出錯。

輸入:

< lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" / >

輸出:

<lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" />

注意:我不想每次都消除>之前的空白。 僅在/因為這是有效的

</lesson >

但這不是

</ lesson>

正則表達式我試過但不能涵蓋所有情況:

\s*< |\/ \\s*

https://regex101.com/r/0LuV0O/1

將此問題視為刪除</之后的空格。

'< lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" / >'
  .replace(/([</])\s*/g, '$1')

輸出:

<lesson id="024AC57B0CA72ADE" classids="5B111F8CD42D0943" />

下面是一個正則表達式,您可以使用它來刪除 HTML 標記中 < 和 / 之后的空格:

re.sub(r'(?<=[<\/])\s+', '', html_string)

此正則表達式使用正后向斷言來匹配 HTML 字符串中緊跟在 < 或 / 字符之后的任何空白字符 (\s+)。 然后使用 re.sub() 方法將匹配的空格替換為空字符串。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM