如何从字符串映射Java中删除/剥离唯一文本

Question

我有一个Map<String,list<String>>数据结构，其中Key具有以下字符串文本：

/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[69]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[70]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[71]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[72]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[73]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[74]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[75]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[76]/PeriodBeginDate[1]

索引号表示该特定元素节点的当前出现。 但是，我想删除仅出现1次的元素的索引。

例：

从：

/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[69]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[70]/PeriodBeginDate[1]

至：

/PayrollFormInfo/CompanyInfo/FederalTotals[69]/PeriodBeginDate
/PayrollFormInfo/CompanyInfo/FederalTotals[70]/PeriodBeginDate

如何在Java中执行此操作

编辑：

@Andreas提出了一个观点。 我当前获得索引XPath的实现在这里：

public String getFullXPath(Node n) {
    if (null == n)
        return null;

    Node parent;
    Stack<Node> hierarchy = new Stack<Node>();
    StringBuilder builder = new StringBuilder();

    hierarchy.push(n);

    switch (n.getNodeType()) {
        case Node.ATTRIBUTE_NODE:
            parent = ((Attr) n).getOwnerElement();
            break;
        case Node.ELEMENT_NODE:
            parent = n.getParentNode();
            break;
        case Node.DOCUMENT_NODE:
            parent = n.getParentNode();
            break;
        default:
            throw new IllegalStateException("Unexpected Node type" + n.getNodeType());
    }

    while (null != parent
            && parent.getNodeType() != Node.DOCUMENT_NODE
            && !parent.getNodeName().equals("section")) {
        hierarchy.push(parent);
        parent = parent.getParentNode();
    }

    Object obj;
    while (!hierarchy.isEmpty() && null != (obj = hierarchy.pop())) {
        Node node = (Node) obj;

        if (node.getNodeType() == Node.ELEMENT_NODE) { 
            builder.append("/").append(node.getNodeName());

            int prev_siblings = 1;
            Node prev_sibling = node.getPreviousSibling();

            while (null != prev_sibling) {
                if (prev_sibling.getNodeType() == node.getNodeType()) {
                    if (prev_sibling.getNodeName().equalsIgnoreCase(node.getNodeName())) {
                        prev_siblings++;
                    }
                }
                prev_sibling = prev_sibling.getPreviousSibling();
            }
            builder.append("[").append(prev_siblings).append("]");
        } 

        else if (node.getNodeType() == Node.ATTRIBUTE_NODE) {
            builder.append("/@");
            builder.append(node.getNodeName());
        }
    }

    return builder.toString();
}

编辑：

根据@Andreas解决方案添加了if（）{} else有条件，但是我没有得到索引全为[1]的输出？

        if (node.getNodeType() == Node.ELEMENT_NODE) { 
            builder.append("/").append(node.getNodeName());

            int prev_siblings = 1;
            Node prev_sibling = node.getPreviousSibling();

            while (null != prev_sibling) {
                if (prev_sibling.getNodeType() == node.getNodeType()) {
                    if (prev_sibling.getNodeName().equalsIgnoreCase(node.getNodeName())) {
                        prev_siblings++;
                    }
                }
                prev_sibling = prev_sibling.getPreviousSibling();
            }
            // edit Outside the while loop
            if(prev_siblings == 1 && node.getNextSibling() == null) {
                continue;
            } else builder.append("[").append(prev_siblings).append("]");
        }

现在我的输出是：

/PayrollFormInfo/PaidPreparerInfo[1]/Address1[1]
/PayrollFormInfo/PaidPreparerInfo[1]/City[1]
/PayrollFormInfo/PaidPreparerInfo[1]/State[1]
/PayrollFormInfo/PaidPreparerInfo[1]/Zip[1]

看起来您的方法有效，但仅适用于根元素。

Answer 1

一种方法可能是在将字符串“ 1 ”放入地图之前将其删除。 像这样

Map<String,list<String>> myMap = new HashMap<String,list<String>>();
//lets say variable 'k' has the key and another list v which has value
String k = "/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[69]/PeriodBeginDate[1]";
myMap.put(k.replace("[1]",""), v);

有关replace函数的更多详细信息：字符串replace（）方法

Answer 2

首先，您必须确定只有1次出现。 例：

/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[70]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[71]/PeriodBeginDate[1]
/PayrollFormInfo[1]/CompanyInfo[1]/FederalTotals[71]/PeriodBeginDate[2]

在此，FederalTotals 70的PeriodBeginDate是单数，而FederalTotals 71的PeriodBeginDate不是单数。

您当前的存储机制使您很难知道哪些可以“缩短”。

您需要为键构建一个层次结构，以便可以检查层次结构中任何节点的“子计数”。

不用在构建第一个地图时添加数字，而是使用新的层次结构构建数据，并在需要时构建“路径”。

Answer 3

使用正则表达式和replaceAll：

str = str.replaceAll("\\[1\\]", "");

有用的链接：

正则表达式Java测试器在线

JavaSE String.replaceAll

Answer 4

通过在问题中添加getFullXPath ，解决方案非常简单。

该方法计算“上一个同级”（+1）的数量以知道要分配的数量。 如果该数字为1，请检查该数字是否具有“下一个同级兄弟”，如果没有，则不要添加该数字。

如何从字符串映射Java中删除/剥离唯一文本

问题描述

4 个解决方案

解决方案1
1 2015-08-27 18:08:53

解决方案2
1 2015-08-27 18:10:27

解决方案3
1 2015-08-27 18:12:22

解决方案4
1 已采纳 2015-08-27 18:40:57

如何从字符串映射Java中删除/剥离唯一文本

问题描述

4 个解决方案

解决方案1 1 2015-08-27 18:08:53

解决方案2 1 2015-08-27 18:10:27

解决方案3 1 2015-08-27 18:12:22

解决方案4 1 已采纳 2015-08-27 18:40:57

解决方案1
1 2015-08-27 18:08:53

解决方案2
1 2015-08-27 18:10:27

解决方案3
1 2015-08-27 18:12:22

解决方案4
1 已采纳 2015-08-27 18:40:57