Jsoup：检查元素是否在另一个元素之前（排序）？

Question

我需要解析 HTML 文本两次并收集不同的元素。 在我的第一次解析中，我用 eg 收集它们

    final Document doc = Jsoup.parse(htmlStr.getContent());
    ArrayList<Element> collectEls=new ArrayList<>();
    final Elements referenceElements = doc.select("[data-coll='first-pass']");
    // some more  logic...
    referenceElements.forEach(el -> collectEls.add(el));

在第二轮类似

    final Elements referenceElements = doc.select("[data-coll='second-pass']");
    // some more  logic...
    referenceElements.forEach(el -> collectEls.add(el));

我不能一次性收集它们。 该算法将非常复杂。 我需要根据 HTML 文本中的 position 对referenceElements进行排序，即类似于

referenceElements.sort((el1,el2) -> el1.compareTo(el2)); //would return true if el1 appears BEFORE el2

老实说，我不知道如何比较它们。 我只找到了before方法，但这是用于插入并且不执行任何类型的检查。 举例来说，我希望el1和el2是不同的，即在意义上没有重叠，一个是另一个的孩子。

Answer 1

我这里没有可用的 Java 编译器，但我认为您可以使用以下信息开始弄清楚它：

解析之前，开启HTML节点的跟踪位置： setTrackPosition https://jsoup.org/apidocs/org/jsoup/parser/Parser.html#setTrackPosition(boolean)
使用 Element 的endSourceRange方法获取元素的结束标记 HTML 的位置，以便将其与其他元素的结束标记 position 进行比较。请参阅https://jsoup.org/apidocs/org/jsoup/nodes/Element。 html#endSourceRange()

Jsoup：检查元素是否在另一个元素之前（排序）？

问题描述

1 个解决方案

解决方案1
1 已采纳 2022-10-11 10:33:05

Jsoup：检查元素是否在另一个元素之前（排序）？

问题描述

1 个解决方案

解决方案1 1 已采纳 2022-10-11 10:33:05

解决方案1
1 已采纳 2022-10-11 10:33:05