簡體   English   中英

使lxml.objectify忽略xml名稱空間?

[英]Making lxml.objectify ignore xml namespaces?

所以我要處理一些看起來像這樣的xml:

<ns2:foobarResponse xmlns:ns2="http://api.example.com">
  <duration>206</duration>
  <artist>
    <tracks>...</tracks>
  </artist>
</ns2:foobarResponse>

我找到了lxml和它的objectify模塊,它允許你以pythonic方式遍歷xml文檔,就像字典一樣。
問題是:每次嘗試訪問元素時都使用偽造的xml命名空間,如下所示:

from lxml import objectify

tree = objectify.fromstring(xml)
print tree.artist
# ERROR: no such child: {http://api.example.com}artist

它正在嘗試使用父命名空間訪問<artist> ,但標記不使用ns。

任何想法如何解決這個問題? 謝謝

根據lxml.objectify 文檔 ,屬性查找默認使用其父元素的命名空間。

你可能想要的工作是:

print tree["{}artist"]

如果你的孩子有一個非空的命名空間(例如“{ http:// foo / } artist”),這樣的QName語法會起作用,但不幸的是,它看起來像當前的源代碼將空命名空間視為沒有命名空間,因此,所有objectify的查找優點將有助於用父命名空間替換空命名空間,並且你運氣不好。

這可能是一個bug(“{}藝術家”應該工作),或者是為lxml人提交的增強請求。

目前,最好的辦法可能是:

print tree.xpath("artist")

我不清楚你在這里使用xpath會有多大的性能影響,但這肯定有效。

僅供參考:請注意,從lxml 2.3開始,這可以正常工作。

從lxml更改日志:

“[...]

2.3(2011-02-06)增加了功能

  • 在尋找孩子時,lxml.objectify將'{} tag'視為空命名空間,而不是父命名空間。

[...]”

在行動:

>>> xml = """<ns2:foobarResponse xmlns:ns2="http://api.example.com">
...   <duration>206</duration>
...   <artist>
...     <tracks>...</tracks>
...   </artist>
... </ns2:foobarResponse>"""
>>> tree = objectify.fromstring(xml)
>>> print tree['{}artist']
artist = None [ObjectifiedElement]
    tracks = '...' [StringElement]
>>>

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM