我正在使用以下代码从scipy运行此SVD求解器:

import numpy as np
from scipy.sparse.linalg import svds

features = np.arange(9,dtype=np.float64).reshape((3,3))
for i in range(10):
    _,_,V = svds(features,2)
    print i,np.mean(V)

我希望每次打印的平均值都相同,但是它会发生变化,并且似乎会循环显示一些喜欢的值。 我很乐意接受这种低水平优化/随机播种的结果。

我不太了解的是为什么每次我运行该脚本时,它将以相同的顺序输出相同的值。 在我看来,似乎是半确定性和半确定性的。

这个问题正在影响一些更复杂的处理,很高兴了解它,因此我至少可以做一些棘手的解决方法。

===============>>#1 票数:1 已采纳

我没有进行自我测试(目前在没有Python shell的平板电脑上),我相信这是由于与近似特征生成器库ARPACK所使用的初始化起点有关的某种奇怪行为,而svds最终调用了该svds

如果您遵循svds的Python代码,则仅_ArpackParams处理v0 (有问题的起点), _ArpackParams其设置为零,并且如果v0 is None则将info参数设置为0 否则, v0保留其值, info1 然后,我们进入的Fortran语言的境界,调用(如果矩阵是双打)的功能dsaupd ,我并没有完全检查,但我假设最终调用cgetv0当请求随机起点。 该函数似乎是在第一次调用时将LAPACK RNG种子初始化为1357

因此,如果您不对ARPACK进行任何其他调用(或可能对其他LAPACK进行任何调用,不确定它们之间如何交互),则每次都使用相同的种子启动RNG,从而每次都获得相同的初始化点时间; 因此,假设这是算法中唯一的随机性来源,您每次都会获得相同的答案序列。

您可以通过在代码开始时随机调用小矩阵上的eigs来解决此问题。

  ask by chris translate from so

未解决问题?本站智能推荐: