繁体   English   中英

给定一个邻接图和多次遍历,优化查找最遍历的边的方法

[英]Optimizing a method to find the most traversed edge given an adjacency graph and several traversals

给我一棵树的N个顶点及其对应的邻接图,用N数组adjGraph[N][N]表示为N。 例如,如果(1,3)是边,则adjGraph[0][2] == 1 否则,对于不是边缘的(i,j)s, adjGraph[i][j] == 0

我得到了以下形式的一系列输入:

1 5

表示从顶点1到顶点5已经遍历了一条路径。我希望找到被遍历次数最多的边以及遍历的次数。 为此,我有另一个N by N数组numPass[N][N] ,我首先将其元素初始化为0,然后每当我确定包含与其索引匹配的边的路径时,将其元素递增1。 例如,如果路径(2,4)包含边(2,3)和(3,4),则我将numPass[1][2]numPass[2][3]增加1。

据我了解,要解决的主要问题是输入仅提供起始顶点和终止顶点的信息,并且由我自己确定哪个边将两者连接。 由于给定的图是一棵树,因此两个顶点之间的任何路径都是唯一的。 因此,我假定在给定任何输入路径的终点顶点的索引的情况下,我将能够递归地回溯连接了哪些边。

以下是我牢记这一想法尝试实现的功能代码:

// find the (unique) path of edges from vertices x to y
// and increment edges crossed during such a path
void findPath(int x, int y, int N, int adjGraph[][N], int numPass[][N]) {
int temp;

// if the path is a single edge, case is trivial
if (adjGraph[x][y] == 1) {
    numPass[x][y] += 1;
    return;
}

// otherwise, find path by backtracking from y
backtrack: while (1) {
    temp = y-1;
    if (adjGraph[temp][y] == 1) {
        numPass[temp][y] += 1;
        break;
    }
}
if (adjGraph[x][temp] == 1) {
    numPass[x][temp] += 1;
    return;
} else {
    y = temp;
    goto backtrack;
}

但是,问题是,尽管我的代码对于小型输入可以正常工作,但对于大型输入却会用尽内存,因为我的内存限制为128MB,时间限制为1秒。 输入范围最多为222222个顶点和222222个输入路径。

如何优化我的方法以满足如此大量的输入?

  1. 摆脱邻接矩阵(它使用O(N^2)空间)。 请改用邻接表。

  2. 使用更有效的算法。 让我们将树植根。 对于从ab的路径,我们可以在ab加1并从其lca中减去1(很容易看到,将a加到该路径的边上并且仅添加到它们)。

  3. 处理完所有路径后,经过边缘的路径数只是子树中的总和。

如果我们使用高效的算法来计算lca,则此解决方案适用于O(N + Q * log N) ,其中Q是路径数。 对于这种约束,它看起来已经足够好了(实际上,通过使用更复杂,更有效的算法来查找lca,我们甚至可以做得更好,但我认为这里没有必要)。

注意:lca表示最低的共同祖先。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM