繁体   English   中英

使用具有预期幂律度分布的图的度数据拟合幂律时的小 KS p 值

[英]small KS p-value in fitting power law using degree data from graph with expected power-law degree distributions

我正在使用 igraph fit_power_law package 中的 fit_power_law function。function 返回“KS.p”(Kolmogorov-Smirnov 检验的 p 值)作为适合度的显着性检验。 据我了解,KS p 值越小,就越有可能拒绝数据来自幂律分布的假设。 换言之,如果希望数据符合幂律分布,则需要较大的 KS p 值。

但是,当我使用sample_fitness_pl function 在具有预期幂律度分布的随机图上尝试此操作时:

set.seed(137)
g <- sample_fitness_pl(10000, 60000, exponent.out=2.2)

然后运行fit_power_law function:

fit_power_law(degree(g))

我得到以下结果:

$continuous
[1] FALSE

$alpha
[1] 2.363965

$xmin
[1] 8

$logLik
[1] -16114.15

$KS.stat
[1] 0.02660938

$KS.p
[1] 0.002639624

KS.p 很小。 如果我将显着性水平设置为 0.05,我可以拒绝度分布是根据幂律得出的。 但是,它是从具有幂律分布度数的图形中提取出来的。 我还遵循了另一种引导方法,根据此处的指导使用poweRlaw来估计 p 值

data_pl = displ$new(degree(g)[degree(g)>0])
est <- estimate_xmin(data_pl)
data_pl$xmin <- est$xmin
data_pl$pars <- est$pars
bs <- bootstrap_p(data_pl)

并且返回的 p 值为 0

bs$p
[1] 0

有人知道如何解释这种差异吗? 任何评论表示赞赏!

引用sample_fitness_sp的文档:

请注意,在游戏的原始公式中,对于小于 3 的指数,可能会观察到显着的有限大小效应。 这个function提供了一个参数,可以通过假设顶点i的适应性为(i+i_0-1)^{ - alpha}来消除有限尺寸的效果边数乘以平均度的根; 有关详细信息,请参阅 Chung 和 Lu 以及 Cho 等人的论文。

即使非常小的差异也可能很重要:

library(igraph)
set.seed(137)
g <- sample_fitness_pl(10000, 60000, exponent.out=2.99999)
fit_power_law(degree(g))["KS.p"]
#> $KS.p
#> [1] 0.1234042

set.seed(137)
g <- sample_fitness_pl(10000, 60000, exponent.out=3)
fit_power_law(degree(g))["KS.p"]
#> $KS.p
#> [1] 0.9999999

最后,您可以设置有限尺寸效应校正来改变这种行为:

set.seed(137)
g <- sample_fitness_pl(10000, 60000, exponent.out=2.2, finite.size.correction = F)
fit_power_law(degree(g))["KS.p"]
#> $KS.p
#> [1] 0.9951813

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM