繁体   English   中英

如何在python中使用lxml遍历所有标记的所有子代以获取数据?

[英]How can I traverse all the children of all tags to get the data using lxml in python?

我想遍历html页面中的所有子节点。 例如<body>......</body>将有许多子标签,我想递归遍历所有这些标签,以使所有标签都不会被忽略。 然后,我想从每个标签中获取文本。 我正在寻找一种通用的解决方案,该解决方案适用于任何可能具有任何结构的网页。 有人可以建议吗? 谢谢

是的, python beautiful soap是一个很棒的python库,具有许多功能。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM