用空名称空间解析xml

Question

我使用lxml解析格式正确的xml：

<search-results xmlns="http://www.w3.org/2005/Atom"
                xmlns:atom="http://www.w3.org/2005/Atom" 
                xmlns:prism="http://prismstandard.org/namespaces/basic/2.0/"
                xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/"
                xmlns:dc="http://purl.org/dc/elements/1.1/">
    <opensearch:totalResults>0</opensearch:totalResults>
    <opensearch:startIndex>0</opensearch:startIndex>
    <opensearch:itemsPerPage>0</opensearch:itemsPerPage>
    <entry>
        <error>Result set was empty</error>
    </entry>
</search-results>

我对error内的文字感兴趣。

我正在使用以下代码：

from lxml import etree

doc = etree.fromstring(xml) # xml is above xml

ns = {'opensearch': "http://a9.com/-/spec/opensearch/1.1/"}
print doc.xpath('//opensearch:totalResults', namespaces=ns)[0].text

哪个可以很好地获得0 ，但是我应该对似乎不在名称空间中的<entry>做什么？ 我尝试添加空的命名空间，我认为它与"http://www.w3.org/2005/Atom"相关联：

ns = {'opensearch': "http://a9.com/-/spec/opensearch/1.1/", 'empty': "http://www.w3.org/2005/Atom"}
print doc.xpath('//entry/error', namespaces=ns)[0].text

但这会导致IndexError ，因为没有列表。

Answer 1

您需要使用为表达式内的空名称空间指定的empty别名：

ns = {'opensearch': "http://a9.com/-/spec/opensearch/1.1/", 'empty': "http://www.w3.org/2005/Atom"}
print doc.xpath('//empty:entry/empty:error', namespaces=ns)[0].text

用空名称空间解析xml

问题描述

1 个解决方案

解决方案1
1 已采纳 2016-02-11 21:12:58

用空名称空间解析xml

问题描述

1 个解决方案

解决方案1 1 已采纳 2016-02-11 21:12:58

解决方案1
1 已采纳 2016-02-11 21:12:58