簡體   English   中英

從字符串中刪除無用的段落標記

[英]Remove useless paragraph tags from string

如果我有一個像這樣的字符串:

<p>&nbsp;</p>
<p></p>
<p class="a"><br /></p>
<p class="b">&nbsp;</p>
<p>blah blah blah this is some real content</p>
<p>&nbsp;</p>
<p></p>
<p class="a"><br /></p>

我怎樣才能把它變成:

<p>blah blah blah this is some real content</p>

正則表達式需要選擇&nbsp; 和空間。

$result = preg_replace('#<p[^>]*>(\s|&nbsp;?)*</p>#', '', $input);

這不會捕獲輸出中的文字字符,但這是非常罕見的。

由於您正在處理HTML,如果這是用戶輸入,我可能會建議使用HTML Purifier,它也將處理XSS漏洞。 您希望在那里刪除空p標簽的配置設置是%AutoFormat.RemoveEmpty。

這個正則表達式將違反您的示例:

<p[^>]*>(?:\s+|(?:&nbsp;)+|(?:<br\s*/?>)+)*</p>

正如最初的回復者所說,正則表達式不是這里最好的解決方案,你想要的是某種html脫衣舞。

此站點上的一項功能: http//nadeausoftware.com/articles/2007/09/php_tip_how_strip_html_tags_web_page

應該幫助你,你只需要使用一些字符串操作來獲得新的行和什么不回到你想要的格式。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM