繁体   English   中英

Python,LXML ElementTree 不会使元素树脱离 STYLE 元素

[英]Python, LXML ElementTree not making elementtree out of STYLE element

我正在尝试从 XML 中获取元素。 似乎对整个文档工作正常,除非我在 STYLE 元素中点击任何内容。 然后 lxml 不构建树。 通过元素后返回正常功能。 我在想它可能是一个保留的元素名称,但我找不到任何证实这一点的东西。 也许我错过了一些明显明显的东西......

import requests
import lxml.html

response = requests.get('http://www.beerxml.com/recipes.xml')

def depth(node):
    d = 0
    while node is not None:
        d += 1
        node = node.getparent()
    return d

tree = lxml.html.fromstring(response.content)

for recipe in tree:
  for child in recipe.iter():
    print(depth(child),child.tag, '\t\t\t',child.text)

结果:

5 style              
 <NAME>Witbier</NAME>
 <VERSION>1</VERSION>
 <CATEGORY>Belgian &amp; French Ale</CATEGORY>
 <CATEGORY_NUMBER>1</CATEGORY_NUMBER>
...

预期结果:

5 style              
6 name Witbier
6 version 1
6 category Belgian &amp; French Ale
6 category_number 1
....

使用import lxml.etree代替import lxml.html

并替换

tree = lxml.html.fromstring(response.content)

tree = lxml.etree.fromstring(response.content)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM