R中的中间性和最短路径

Question

我一直在评论这篇有趣的文章：

http://kieranhealy.org/blog/archives/2013/06/09/using-metadata-to-find-paul-revere/

作为练习，我一直在仔细研究采取各种步骤，以定罪叛逆者里维尔先生。 一方面，作者使用igraph库的interweenness函数 ，其描述为：

“顶点和边之间的距离（大致）由经过顶点或边的测地线（最短路径）的数量定义。”

因此，就本文而言，正在考虑的254个人中的每对之间有多少条最短的通信路径？ 不过，我从这篇文章中挪了些头，我想知道我是否在幼稚地思考。

254 x 254矩阵具有64516个元素。 但是，可以忽略琐碎的元素（对角线上的那些人-一个与自己说话的人显然是从X到X的最短路径），从而使254 * 254-254 = 64262总非琐碎的有序配对成为可能。 但是，这些不是定向的，也就是说，特定X对和Y对之间的最短路径是相同的，而不管X或Y中的哪个是发送方，哪个是接收方。

因此，我们可以减少配对的数量： (254 * 254 - 254) / 2 = 32131 。

由于这也恰好是从254个中选择的2个组合的数量，甚至更好-巧合！ ;-)

然后，只是为了好玩，我做了：

((254 * 254 - 254) / 2) - sum(betweenness(person.g)) = 10061

这个数字是什么意思？ 几乎可以说，有10,061个配对不存在任何路径，但我不知道该怎么做。 我会误会两者之间吗？ 提前谢谢了。

Answer 1

如果检查简单图上发生的情况，您会注意到长度为1的最短路径不会进入计算。

betweenness( graph.lattice( 3 ) )
# [1] 0 1 0

长度为2的最短路径将被使用一次（用于中间的点），但是长度为3或更长的最短路径将被使用几次：对于中间的每个点将使用一次。

betweenness( graph.lattice( 5 ) )
# [1] 0 3 4 3 0

在此示例中，最短路径是

length 1: 1-2, 2-3, 3-4, 4-5  (not used)
length 2: 1-3, 2-4, 3-5       (each used once, for the betweenness of 2, 3 and 4)
length 3: 1-4, 2-5            (each used twice, for 2,3 and 2,4)
length 4: 1-5                 (each used 3 times, for 2, 3 and 4)

换句话说，长度为k的最短路径被计算为k-1次。

p <- shortest.paths(person.g)
sum( p[upper.tri(p)] - 1 )
# [1] 22070
sum( betweenness( person.g ) )
# [1] 22070

R中的中间性和最短路径

问题描述

1 个解决方案

解决方案1
1 已采纳 2013-08-22 17:49:12

R中的中间性和最短路径

问题描述

1 个解决方案

解决方案1 1 已采纳 2013-08-22 17:49:12

解决方案1
1 已采纳 2013-08-22 17:49:12