繁体 English 中英

Python lxml 无法获取所有文本

[英]Python lxml cannot get all text

原文 2020-09-15 07:14:37 5 1 python/ python-3.x/ lxml

我正在使用 Python lxml库来解析 HTML。 我有叶点，例如<a>并想获取其父级的文本。 我尝试通过两种方式做到这一点：

.xpath('::parent*') ,
.getparent().text 。

from lxml.etree import HTML
text = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'

parsed = HTML(text)
parsed.xpath('//a')[0].getparent().text
parsed.xpath('//a/parent::*')[0].text

我使用任何一种方法都获得了FIRST PART ，但是如何获得SECOND PART ？

1 个解决方案

您可以使用.itertext()元素的方法：

from lxml.etree import HTML

text = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'
parsed = HTML(text)

parent = parsed.xpath('//a/parent::*')[0]
text = list(parent.itertext())
print(text[0])
print(text[-1])

印刷：

FIRST PART
SECOND PART

无法在 xpath (lxml/python) 中获取文本

[英]cannot get text in xpath (lxml/ python)

获取lxml节点中的所有文本

[英]Get all text in an lxml node

Python：lxml 不是一直在读取元素文本

[英]Python: lxml is not reading element text all time

获取 lxml 中标签内的所有文本

[英]Get all text inside a tag in lxml

lxml etree获取元素之前的所有文本

[英]lxml etree get all text before element

获取源代码行lxml python中的所有元素

[英]get all elements in source line lxml python

在lxml / Python中获取所选元素旁边的文本

[英]Get text next to selected element in lxml / Python

Python lxml - 获取标签文本的索引

[英]Python lxml - get index of tag's text

获取元素并使用python和lxml更改元素文本

[英]get element and change element text with python and lxml

Python lxml xpath 无法获取文本

[英]Python lxml xpath unable to get text

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 无法在 xpath (lxml/python) 中获取文本获取lxml节点中的所有文本 Python：lxml 不是一直在读取元素文本获取 lxml 中标签内的所有文本 lxml etree获取元素之前的所有文本获取源代码行lxml python中的所有元素在lxml / Python中获取所选元素旁边的文本 Python lxml - 获取标签文本的索引获取元素并使用python和lxml更改元素文本 Python lxml xpath 无法获取文本

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM