Java，XPath表达式读取所有节点名称，节点值和属性

Question

在制作xpath表达式以读取XML字符串中的所有节点名称，节点值和属性时，我需要帮助。 我做的：

private List<String> listOne = new ArrayList<String>();
private List<String> listTwo = new ArrayList<String>();

public void read(String xml) {
    try {
        // Turn String into a Document
        Document document = DocumentBuilderFactory.newInstance()
                .newDocumentBuilder().parse(new ByteArrayInputStream(xml.getBytes()));

        // Setup XPath to retrieve all tags and values
        XPath xPath = XPathFactory.newInstance().newXPath();
        NodeList nodeList = (NodeList) xPath.evaluate("//text()[normalize-space()='']", document, XPathConstants.NODESET);

        // Iterate through nodes
        for(int i = 0; i < nodeList.getLength(); i++) {
            Node node = nodeList.item(i);
            listOne.add(node.getNodeName());
            listTwo.add(node.getNodeValue());
            // Another list to hold attributes
        }

    } catch(Exception e) {
        LogHandle.info(e.getMessage());
    }
}

我在线找到表达式//text()[normalize-space()=''] ; 但是，它不起作用。 当我尝试从listOne获取节点名称时，它只是#text 。 我试过// ，但这也不起作用。 如果我有这个XML：

<Data xmlns="Somenamespace.nsc">
    <Test>blah</Test>
    <Foo>bar</Foo>
    <Date id="2">12242016</Date>
    <Phone>
        <Home>5555555555</Home>
        <Mobile>5555556789</Mobile>
    </Phone>
</Data>

listOne[0]应该包含Data ， listOne[1]应该包含Test ， listTwo[1]应该包含blah等，...所有属性将保存在另一个并行列表中。

xPath应该评估什么表达式？

注意：XML字符串可以具有不同的标记，因此我不能对任何东西进行硬编码。

更新：尝试了此循环：

NodeList nodeList = (NodeList) xPath.evaluate("//*", document, XPathConstants.NODESET);

// Iterate through nodes
for(int i = 0; i < nodeList.getLength(); i++) {
    Node node = nodeList.item(i);

    listOne.add(i, node.getNodeName());

    // If null then must be text node
    if(node.getChildNodes() == null)
        listTwo.add(i, node.getTextContent());
}

但是，这仅获取根元素Data ，然后停止。

Answer 1

//*将选择所有元素节点， //@*所有属性节点。 但是，元素节点在DOM中没有有意义的节点值，因此您需要读出getTextContent()而不是getNodeValue 。

正如您似乎认为带有子元素的元素具有“空”值一样，我认为您需要检查是否有任何子元素：

    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
    docBuilderFactory.setNamespaceAware(true);

    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();

    Document doc = docBuilder.parse("sampleInput1.xml");

    XPathFactory fact = XPathFactory.newInstance();
    XPath xpath = fact.newXPath();

    NodeList allElements = (NodeList)xpath.evaluate("//*", doc, XPathConstants.NODESET);

    ArrayList<String> elementNames = new ArrayList<>();
    ArrayList<String> elementValues = new ArrayList<>();

    for (int i = 0; i < allElements.getLength(); i++)
    {
        Node currentElement = allElements.item(i);
        elementNames.add(i, currentElement.getLocalName());
        elementValues.add(i, xpath.evaluate("*", currentElement, XPathConstants.NODE) != null ? null : currentElement.getTextContent());
    }

    for (int i = 0; i < elementNames.size(); i++)
    {
        System.out.println("Name: " + elementNames.get(i) + "; value: " + (elementValues.get(i)));
    }

对于样本输入

<Data xmlns="Somenamespace.nsc">
    <Test>blah</Test>
    <Foo>bar</Foo>
    <Date id="2">12242016</Date>
    <Phone>
        <Home>5555555555</Home>
        <Mobile>5555556789</Mobile>
    </Phone>
</Data>

输出是

Name: Data; value: null
Name: Test; value: blah
Name: Foo; value: bar
Name: Date; value: 12242016
Name: Phone; value: null
Name: Home; value: 5555555555
Name: Mobile; value: 5555556789

Java，XPath表达式读取所有节点名称，节点值和属性

问题描述

1 个解决方案

解决方案1
1 已采纳 2016-06-13 20:02:18

Java，XPath表达式读取所有节点名称，节点值和属性

问题描述

1 个解决方案

解决方案1 1 已采纳 2016-06-13 20:02:18

解决方案1
1 已采纳 2016-06-13 20:02:18