繁体 English 中英

如何在python中使用lxml遍历所有标记的所有子代以获取数据？

[英]How can I traverse all the children of all tags to get the data using lxml in python?

原文 2015-09-05 08:13:24 8 1 python/ lxml

我想遍历html页面中的所有子节点。 例如<body>......</body>将有许多子标签，我想递归遍历所有这些标签，以使所有标签都不会被忽略。 然后，我想从每个标签中获取文本。 我正在寻找一种通用的解决方案，该解决方案适用于任何可能具有任何结构的网页。 有人可以建议吗？ 谢谢

1 个解决方案

是的， python beautiful soap是一个很棒的python库，具有许多功能。

如何使用 python 的 lxml.etree 库从 xml 标签的所有嵌套标签中获取所有字符串？

[英]How to get all strings from all nested tags of a xml tag with python's lxml.etree library?

我如何使用lxml和python遍历 <body> html文档及其子元素

[英]How do I use lxml and python to traverse the <body> of a html document along with its children

如何使用lxml删除python中与xpath匹配的所有元素？

[英]How can I remove all elements matching an xpath in python using lxml?

如何使用python获取XML中的所有标签？

[英]How to get all the tags in an XML using python?

如何去除 xml 标记中的所有子标记，但使用 python 中的 lxml 将文本合并到括号？

[英]how to strip all child tags in an xml tag but leaving the text to merge to the parens using lxml in python?

如何使用类似于 ElementTree 的 lxml 遍历 XML 文档标签

[英]How to traverse through XML document tags using lxml similarly to ElementTree

python lxml遍历所有标签

[英]python lxml loop through all tags

我如何从使用python的lxml etree和xpath选择的节点获取（打印）所有内部html？

[英]How could I get (print) all inner html from node which I select using python's lxml etree and xpath?

使用python lxml和XSD模式获取xml数据中的所有无效元素

[英]Get All invalid elements in xml data using python lxml and XSD schema

使用Python lxml.html如何在链接标记中找到图像？

[英]Using Python lxml.html how can I find images within link tags?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用 python 的 lxml.etree 库从 xml 标签的所有嵌套标签中获取所有字符串？我如何使用lxml和python遍历 <body> html文档及其子元素如何使用lxml删除python中与xpath匹配的所有元素？如何使用python获取XML中的所有标签？如何去除 xml 标记中的所有子标记，但使用 python 中的 lxml 将文本合并到括号？如何使用类似于 ElementTree 的 lxml 遍历 XML 文档标签 python lxml遍历所有标签我如何从使用python的lxml etree和xpath选择的节点获取（打印）所有内部html？使用python lxml和XSD模式获取xml数据中的所有无效元素使用Python lxml.html如何在链接标记中找到图像？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM