[英]How to get all strings from all nested tags of a xml tag with python's lxml.etree library?
[英]How can I traverse all the children of all tags to get the data using lxml in python?
我想遍历html页面中的所有子节点。 例如<body>......</body>
将有许多子标签,我想递归遍历所有这些标签,以使所有标签都不会被忽略。 然后,我想从每个标签中获取文本。 我正在寻找一种通用的解决方案,该解决方案适用于任何可能具有任何结构的网页。 有人可以建议吗? 谢谢
是的, python beautiful soap是一个很棒的python库,具有许多功能。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.