XPATH-获取父级和子级的元组

Question

假设这是我的XML：

<animals>
   <mammals> 
      <an>dog</an>
      <an>cat</an>
   </mammals>
   <reptiles>
      <an>snake</an>
   </reptiles>
</animals>

我想要的是使用xpath获得类似的元组：

(mammals,dog)
(mammals,cat)
(reptiles,snake)

要分别获取它们，或者通过两个查询来获取它们都很容易。 我想知道是否有一种方法可以在1个xpath查询中获取它（或非常相似的输出）。

任何帮助将不胜感激！

Answer 1

使用lxml ：

from io import StringIO

from lxml import etree

xml = """<animals>
   <mammals> 
      <an>dog</an>
      <an>cat</an>
   </mammals>
   <reptiles>
      <an>snake</an>
   </reptiles>
</animals>"""

tree = etree.parse(StringIO(xml))

for x in tree.xpath("/animals/*"):
    for y in x:
        print((x.tag, y.text))

输出：

('mammals', 'dog')
('mammals', 'cat')
('reptiles', 'snake')

Answer 2

尝试在python中使用xml模块

from xml.etree import  ElementTree

def parse_data(xml_str):
    output = []
    tree = ElementTree.fromstring(xml_str)
    for m in tree.getchildren():
        for n in m.getchildren():
           output.append((m.tag, n.text,))
    return output

xml_str = '''
<animals>
   <mammals> 
      <an>dog</an>
      <an>cat</an>
   </mammals>
   <reptiles>
      <an>snake</an>
   </reptiles>
</animals>'''

print parse_data(xml_str)
# output: [('mammals', 'dog'), ('mammals', 'cat'), ('reptiles', 'snake')]

Answer 3

在XPath 2.0或以上，你可以使用for结构（演示）：

for $x in /animals/*/*
return concat($x/parent::*/name(), ',', $x/text())

但是在仅支持XPath 1.0的lxml ，我们需要将其替换为python的for循环：

from lxml import etree

raw = """<animals>
   <mammals> 
      <an>dog</an>
      <an>cat</an>
   </mammals>
   <reptiles>
      <an>snake</an>
   </reptiles>
</animals>"""
root = etree.fromstring(raw)

for x in root.xpath("/animals/*/*"):
    print (x.getparent().tag, x.text)

Answer 4

该xpath返回请求的字符串，但仅返回第一个元素。 使用纯XPath可能很难

'concat("(", local-name(//animals/*), ",", //animals/*/an/text(), ")")'

xmllint --xpath 'concat("(", local-name(//animals/*), ",", //animals/*/an/text(), ")")' ~/tmp/test.xml
(mammals,dog)

XPATH-获取父级和子级的元组

问题描述

4 个解决方案

解决方案1
2 已采纳

解决方案2
1 2018-01-24 12:58:48

解决方案3
1 2018-01-24 13:31:14

解决方案4
0 2018-01-24 13:03:50

XPATH-获取父级和子级的元组

问题描述

4 个解决方案

解决方案1 2 已采纳

解决方案2 1 2018-01-24 12:58:48

解决方案3 1 2018-01-24 13:31:14

解决方案4 0 2018-01-24 13:03:50

解决方案1
2 已采纳

解决方案2
1 2018-01-24 12:58:48

解决方案3
1 2018-01-24 13:31:14

解决方案4
0 2018-01-24 13:03:50