繁体   English   中英

jsoup.text()和jsoup.body()。text()之间的区别

[英]Difference between jsoup.text() and jsoup.body().text()

使用Jsoup库,我试图从HTML字符串中获取内容(仅文本)。 有两种方法可以给我提供内容:

Jsoup.parse(htmlString).body().text()
Jsoup.parse(htmlString).text()

我知道第一种方法将仅返回正文。 第二种方法返回什么? 哪种更适合我的用法?

注意 :根据文档,text方法用于设置文档正文的文本

每个元素都有方法text()

public java.lang.String text()获取此元素及其所有子元素的组合文本。 空格已标准化并修剪。

所有元素都可以包含文本节点( node.nodeName()返回#text), 应该是正文的一部分 ,除了<title>标签( <script><style>标签具有子节点)节点名称为#data)。

因此,只要未在标题中设置标题标签,有效页面就会为document.body().text()document.text()返回相同的文本,否则document.text()将另外包含标题文本。

第二行包括整个HTML文档中的文本,包括标题,标题和正文,而第一行仅包括正文中的文本。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM