解析嵌套标签XML Java时遇到困难

Question

我正在从字典API解析定义。 我有这行xml

<dt>:any of a small genus (<it>Apteryx</it>) of flightless New Zealand birds with rudimentary wings, stout legs, a long bill, and grayish brown hairlike plumage</dt>

我将如何获得dt元素的完整行。 我的问题是，当它到达此部分（Apteryx）时它不起作用，因为该元素中还有其他标签。 我如何将整个dt元素作为一个完整的字符串。 这是我当前的代码。

Element def = (Element) element.getElementsByTagName("def").item(0);
System.out.println(getValue("dt",def).replaceAll("[^\\p{L}\\p{N} ]", ""));

其中def是保存dt元素的元素。

这是我的getValue代码

private static String getValue(String tag, Element element)
{
    NodeList nodes = element.getElementsByTagName(tag).item(0).getChildNodes();
    Node node = (Node) nodes.item(0);
    return node.getNodeValue();
}

有时dt元素内有多个嵌套标签

Answer 1

混合https://stackoverflow.com/a/5948326/145757并在Java DOM中获取节点的内部XML作为String，我们得到：

public static String getInnerXml(Node node)
{
    DOMImplementationLS lsImpl = (DOMImplementationLS)node.getOwnerDocument().getImplementation().getFeature("LS", "3.0");
    LSSerializer lsSerializer = lsImpl.createLSSerializer();
    lsSerializer.getDomConfig().setParameter("xml-declaration", false);
    NodeList childNodes = node.getChildNodes();
    StringBuilder sb = new StringBuilder();
    for (int i = 0; i < childNodes.getLength(); i++)
    {
       sb.append(lsSerializer.writeToString(childNodes.item(i)));
    }
    return sb.toString(); 
}

添加我的评论，这给出了：

getInnerXml(document.getElementsByTagName("dt").item(0));

结果：

:any of a small genus (<it>Apteryx</it>) of flightless New Zealand birds...

希望这可以帮助...

解析嵌套标签XML Java时遇到困难

问题描述

1 个解决方案

解决方案1
0 2013-06-11 15:55:00

解析嵌套标签XML Java时遇到困难

问题描述

1 个解决方案

解决方案1 0 2013-06-11 15:55:00

解决方案1
0 2013-06-11 15:55:00