python的lxml和iterparse方法

Question

说我有这个示例XML。

<result>
    <field k='field1'>
        <value h='1'><text>text_value1</text></value>
    </field>
    <field k='field2'>
        <value><text>text_value2</text></value>
    </field>
    <field k='field3'>
        <value><text>some_text</text></value>
    </field>
</result>

使用python的lxml，我如何获得每个结果集的每个字段的值？ 基本上，我想迭代结果集，然后遍历该结果集中的每个字段并打印文本数据。

这是我到目前为止：

context = etree.iterparse(contentBuffer, tag='result')
for action, elem in context:
    print elem.tag, elem.data

任何帮助将不胜感激。

编辑这是我想出的代码。 看起来有点笨拙，不得不两次调用getparent（）来读取相应文本值的属性。 有一个更好的方法吗？

for action, elem in context:
    list = elem.xpath('//text')
    print "result set:"
    for item in list:
        field = item.getparent().getparent().attrib['k']
        value = item.text
        print "\t%s = %s"%(field, value)

Answer 1

怎么样：

import io
import lxml.etree as ET

content='''\
<result>
    <field k='field1'>
        <value h='1'><text>text_value1</text></value>
    </field>
    <field k='field2'>
        <value><text>text_value2</text></value>
    </field>
    <field k='field3'>
        <value><text>some_text</text></value>
    </field>
</result>'''

contentBuffer=io.BytesIO(content)
context = ET.iterparse(contentBuffer,tag='result')
for action, elem in context:
    fields=elem.xpath('field/@k')
    values=elem.xpath('field/value/text/text()')
    for field,value in zip(fields,values):
        print('\t{f} = {v}'.format(f=field,v=value))

产量

field1 = text_value1
field2 = text_value2
field3 = some_text

Answer 2

我建议使用XPath查询。 沿着r = tree.xpath('//text')应该足以满足您的需求。

python的lxml和iterparse方法

问题描述

2 个解决方案

解决方案1
4 已采纳 2011-03-31 15:39:57

解决方案2
1 2011-03-31 14:43:37

python的lxml和iterparse方法

问题描述

2 个解决方案

解决方案1 4 已采纳 2011-03-31 15:39:57

解决方案2 1 2011-03-31 14:43:37

解决方案1
4 已采纳 2011-03-31 15:39:57

解决方案2
1 2011-03-31 14:43:37