繁体 English 中英

在lxml.html中，如何获取节点的文本，子级和子级内容？

[英]in lxml.html how do i grab the text, children and content of children of a node?

原文 2011-08-26 18:49:26 8 2 python/ lxml

我正在使用python的lxml.html。 我有一个xpath表达式，它可以获取节点的文本，但我需要的是所有文本，包括子标签和其内容的标签。 我该如何实现？

2 个解决方案

Element的text_content方法返回元素的文本，包括没有标记的子元素的文本内容。

我不确定您使用的是什么标签； 因此，我弥补了。

您可以尝试：

result = lxml.html.parse(url).xpath("//tr/td/a/text()")

// tr表示无论在何处，都从当前节点中选择与选择匹配的节点。

您可以使用此（'//'）表达式来掌握children标签的标签。

我该如何保存？ <br> 作为lxml.html text_content（）或等效的换行符？

[英]How can I preserve <br> as newlines with lxml.html text_content() or equivalent?

使用lxml.html提取文本

[英]Extract text with lxml.html

pythons lxml.html，一次抓取所有

[英]pythons lxml.html, grab all at once

如何使用 lxml.html 从 HTML 元素获取文本

[英]How to get text from HTML element by using lxml.html

BeautifulSoup / LXML.html：如果孩子看起来像x，则删除标签及其子项

[英]BeautifulSoup/LXML.html: delete tag and its children if child looks like x

我如何使用lxml和python遍历 <body> html文档及其子元素

[英]How do I use lxml and python to traverse the <body> of a html document along with its children

如何在lxml.html中删除无关紧要的空格？

[英]How to remove insignificant whitespace in lxml.html?

Python：使用“lxml.html”将 HTML 内容注入标签

[英]Python: Injecting HTML content into a tag using `lxml.html`

在lxml.html元素的文本中搜索特殊的HTML字符

[英]Search for special HTML characters in text of lxml.html elements

python lxml.html：提取html docstring中的先前文本

[英]python lxml.html: pull preceding text in html docstring

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 我该如何保存？ <br> 作为lxml.html text_content（）或等效的换行符？使用lxml.html提取文本 pythons lxml.html，一次抓取所有如何使用 lxml.html 从 HTML 元素获取文本 BeautifulSoup / LXML.html：如果孩子看起来像x，则删除标签及其子项我如何使用lxml和python遍历 <body> html文档及其子元素如何在lxml.html中删除无关紧要的空格？ Python：使用“lxml.html”将 HTML 内容注入标签在lxml.html元素的文本中搜索特殊的HTML字符 python lxml.html：提取html docstring中的先前文本

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM