O（1）算法确定节点是否是多路树中另一个节点的后代？

Question

想象一下以下的树：

    A
   / \
  B   C
 / \   \
D   E   F

我正在寻找一种方法来查询例如F是否是A的后代（注意：F不需要是A的直接后代），在这种情况下，这将是真的。 只需要针对较大的潜在后代节点池测试有限数量的潜在父节点。

在测试节点是否是潜在父池中节点的后代时，需要针对所有潜在父节点对其进行测试。

这是一个想法：

将多路树转换为trie，即将以下前缀分配给上述树中的每个节点：
```
  A = 1 B = 11 C = 12 D = 111 E = 112 F = 121 
```
然后，为每个可能的前缀大小保留一个位数组，并添加要测试的父节点，即如果将C添加到潜在的父节点池，请执行以下操作：
```
  1 2 3 <- Prefix length *[1] [1] ... [2] *[2] ... [3] [3] ... [4] [4] ... ... ... 
```
当测试节点是否是潜在父节点的后代时，取其trie前缀，查找第一个“前缀数组”中的第一个字符（见上文），如果存在，则在第二个“前缀中查找第二个前缀字符数组“依此类推，即测试F导致：
```
  F = 1 2 1 *[1] [1] ... [2] *[2] ... [3] [3] ... [4] [4] ... ... ... 
```
所以是的，F是C.的后代。

这个测试似乎是最坏的情况O（n），其中n =最大前缀长度=最大树深度，所以它的最坏情况恰好等于上升树和比较节点的显而易见的方式。 但是，如果测试节点靠近树的底部并且潜在的父节点位于顶部某处，则执行得更好。 结合两种算法可以减轻最坏情况。 但是，内存开销是一个问题。

还有另一种方法吗？ 任何指针非常感谢！

Answer 1

您的输入树是否始终是静态的？ 如果是这样，那么您可以使用最低公共祖先算法在O（1）时间内使用O（n）时间/空间构造回答后代问题。 LCA查询被给予两个节点并询问哪个是树的最低节点，其子树包含两个节点。 然后，您可以使用单个LCA查询回答IsDescendent查询，如果LCA（A，B）== A或LCA（A，B）== B，则一个是另一个的后代。

这个Topcoder算法课程提供了对问题的全面讨论以及各种代码复杂性/效率级别的解决方案。

Answer 2

我不知道这是否适合你的问题，但是一种在数据库中存储层次结构的方法，快速“给我这个节点和向下的所有东西”功能就是存储一个“路径”。

例如，对于看起来像这样的树：

    +-- b
    |
a --+       +-- d
    |       |
    +-- c --+
            |
            +-- e

你会按如下方式存储行，假设上面树中的字母是每行的“id”：

id    path
a     a
b     a*b
c     a*c
d     a*c*d
e     a*c*e

要查找特定节点的所有后代，您可以在路径列上执行“STARTSWITH”查询，即。 所有节点的路径a*c*开头

要查明特定节点是否是另一个节点的后代，您将看到最长路径是否以最短路径开始。

例如：

e是a a*c*e以a开头的后代
d是c的后代，因为a*c*d以a*c开头

这对你的实例有用吗？

Answer 3

遍历任何树将需要“树深度”步骤。 因此，如果您维护平衡的树结构，则可以证明您需要执行查找操作的O（log n）操作。 根据我的理解，你的树看起来很特别，你无法以平衡的方式保持它，对吧？ 所以O（n）是可能的。 但是在树的创建过程中这很糟糕，所以你可能会在使用查找之前死掉...

根据您与insert相比需要查找操作的频率，您可以决定在插入期间支付以维护额外的数据结构。 如果你真的需要摊销O（1），我会建议哈希。 在每次插入操作中，您将节点的所有父节点放入哈希表中。 根据您的描述，这可能是给定插入物上的O（n）项。 如果你做n 插入这听起来很糟糕（朝向O（n ^ 2） ），但实际上你的树不能降低那个坏，所以你可能得到一个摊销的总体不稳定大小O（n log n） 。 （实际上， log n部分取决于树的降阶程度。如果你认为它最大程度地降级，请不要这样做。）

因此，您将在每个插入上支付大约O（log n） ，并获得哈希表效率O（1）以进行查找。

Answer 4

对于M路树而不是位数组，为什么不将每个节点存储二进制“trie id” （每个级别使用M位） ？ 对于您的示例（假设M == 2） ： A=0b01, B=0b0101, C=0b1001, ...

然后你可以在O（1）中进行测试：

bool IsParent(node* child, node* parent)
{ 
   return ((child->id & parent->id) == parent->id)
}

如果你有一个快速FindMSB（）函数返回最高有效位集的位置，你可以将存储压缩到每层的ceil（lg2（M））位：

mask = (1<<( FindMSB(parent->id)+1) ) -1;
retunr (child->id&mask == parent->id);

Answer 5

在预先遍历中，每组后代都是连续的。 以你为例，

A B D E C F
+---------+ A
  +---+ B
    + D
      + E
        +-+ C
          + F

如果可以预处理，那么您需要做的就是为每个节点编号并计算后代间隔。

如果无法预处理，则链接/剪切树为更新和查询提供O（log n）性能。

Answer 6

您可以回答“节点A是节点B的后代吗？”形式的查询。 在恒定的时间内，只需使用两个辅助阵列。

通过以深度优先顺序访问来预处理树，并且对于每个节点A，在两个数组Start []和End []中存储其访问的开始和结束时间。

所以，让我们说End [u]和Start [u]分别是节点u访问的结束和开始时间。

然后节点u是节点v的后代，当且仅当：

开始[v] <=开始[u]和结束[u] <=结束[v]。

你完成了，检查这个条件只需要在数组Start和End中进行两次查找

Answer 7

看看嵌套集模型选择非常有效，但更新速度太慢

O（1）算法确定节点是否是多路树中另一个节点的后代？

问题描述

7 个解决方案

解决方案1
7 已采纳 2011-05-16 17:51:51

解决方案2
4 2011-05-16 16:34:48

解决方案3
3 2011-05-16 16:48:15

解决方案4
2 2011-05-16 16:38:53

解决方案5
1 2011-05-16 17:11:09

解决方案6
0 2012-11-24 15:49:32

解决方案7
0 2018-04-11 09:24:54

O（1）算法确定节点是否是多路树中另一个节点的后代？

问题描述

7 个解决方案

解决方案1 7 已采纳 2011-05-16 17:51:51

解决方案2 4 2011-05-16 16:34:48

解决方案3 3 2011-05-16 16:48:15

解决方案4 2 2011-05-16 16:38:53

解决方案5 1 2011-05-16 17:11:09

解决方案6 0 2012-11-24 15:49:32

解决方案7 0 2018-04-11 09:24:54

解决方案1
7 已采纳 2011-05-16 17:51:51

解决方案2
4 2011-05-16 16:34:48

解决方案3
3 2011-05-16 16:48:15

解决方案4
2 2011-05-16 16:38:53

解决方案5
1 2011-05-16 17:11:09

解决方案6
0 2012-11-24 15:49:32

解决方案7
0 2018-04-11 09:24:54