簡體   English   中英

如何從JSoup'Document'中刪除不間斷的空格?

[英]How can I remove non-breaking spaces from a JSoup 'Document'?

我該如何刪除這些:

<td>&nbsp;</td>

要么

<td width="7%">&nbsp;</td>

來自我的JSoup'文檔'? 我嘗試了很多方法,但是這些不間斷的空格字符與普通的JSoup表達式或選擇器不匹配。

HTML實體&nbsp; Unicode字符NO-BREAK SPACE U + 00A0 )可以在Java中用字符 假設您要刪除包含該字符的每個元素作為自己的文本(因此不是您在評論中所說的每一 ),那么以下內容應該有效:

document.select(":containsOwn(\u00a0)").remove();

如果你真的想刪除整行,那么你最好的選擇就是逐行掃描HTML。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM