[英]How can I get the non-breaking spaces between two nodes when using a node visitor?
[英]How can I remove non-breaking spaces from a JSoup 'Document'?
我该如何删除这些:
<td> </td>
要么
<td width="7%"> </td>
来自我的JSoup'文档'? 我尝试了很多方法,但是这些不间断的空格字符与普通的JSoup表达式或选择器不匹配。
HTML实体
( Unicode字符NO-BREAK SPACE U + 00A0 )可以在Java中用字符\
。 假设您要删除包含该字符的每个元素作为自己的文本(因此不是您在评论中所说的每一行 ),那么以下内容应该有效:
document.select(":containsOwn(\u00a0)").remove();
如果你真的想删除整行,那么你最好的选择就是逐行扫描HTML。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.