在给定转移概率矩阵的情况下寻找马尔可夫过程的平稳分布

Question

Stack Overflow 上有两个线程与此问题相关：

如何在给定转移概率矩阵的情况下获得马尔可夫链的平稳分布描述了转移概率矩阵是什么，并演示了如何通过获取该矩阵的幂来达到平稳分布；
如何找到矩阵何时收敛于循环使用 R 循环来确定矩阵幂何时收敛。

上面的很简单，但是很贵。 如果我们有一个n阶转换矩阵，那么在每次迭代时，我们都会以O(n ^ 3)成本计算矩阵-矩阵乘法。

有没有更有效的方法来做到这一点？ 我想到的一件事是使用特征分解。 已知马尔可夫矩阵：

在复域中可对角化： A = E * D * E^{-1} ；
具有 1 的实特征值，以及长度小于 1 的其他（复数）特征值。

平稳分布是与特征值 1 相关联的特征向量，即第一个特征向量。

嗯，理论很好，但我无法让它发挥作用。 在第一个链接问题中取矩阵P ：

P <- structure(c(0, 0.1, 0, 0, 0, 0, 0, 0.1, 0.2, 0, 0, 0, 0, 0, 0.2, 
0.3, 0, 0, 0.5, 0.4, 0.3, 0.5, 0.4, 0, 0, 0, 0, 0, 0.6, 0.4, 
0.5, 0.4, 0.3, 0.2, 0, 0.6), .Dim = c(6L, 6L))

如果我做：

Re(eigen(P)$vectors[, 1])
# [1] 0.4082483 0.4082483 0.4082483 0.4082483 0.4082483 0.4082483

这是怎么回事？ 根据前面的问题，平稳分布是：

# [1] 0.002590673 0.025906737 0.116580322 0.310880848 0.272020713 0.272020708

Answer 1

好吧，要使用特征分解，我们需要使用t(P) 。

转移概率矩阵的定义在概率/统计和线性代数之间有所不同。 在统计中， P所有行总和为 1，而在线性代数中， P所有列总和为 1。因此，我们需要eigen(t(P))而不是eigen(P) eigen(t(P)) ：

e <- Re(eigen(t(P))$vectors[, 1])
e / sum(e)
# [1] 0.002590673 0.025906737 0.116580322 0.310880848 0.272020713 0.272020708

正如我们所见，我们只使用了第一个特征向量，即最大特征值的特征向量。 因此，无需使用eigen计算所有特征值/向量。 幂方法可用于找到最大特征值的特征向量。 让我们在 R 中实现它：

stydis1 <- function (A) {
  n <- dim(A)[1L]
  ## checking
  if (any(.rowSums(A, n, n) != 1)) 
    stop (" 'A' is not a Markov matrix")
  ## implement power method
  e <- runif (n)
  oldnorm <- sqrt(c(crossprod(e)))
  repeat {
    e <- crossprod(A, e)
    newnorm <- sqrt(c(crossprod(e)))
    if (abs(newnorm / oldnorm - 1) < 1e-8) break
    e <- e / newnorm
    oldnorm <- newnorm
    }
  ## rescale `e` so that it sums up to 1
  c(e / sum(e))
  }

stydis1 (P)
# [1] 0.002590673 0.025906737 0.116580322 0.310880848 0.272020713 0.272020708

结果是正确的。

事实上，我们不必利用特征分解。 我们可以调整您在第二个链接问题中使用的方法。 在那里，我们采用了矩阵功率，正如您所评论的那样昂贵； 但为什么不将其重新转换为矩阵向量乘法呢？

stydis2 <- function (A) {
  n <- dim(A)[1L]
  ## checking
  if (any(.rowSums(A, n, n) != 1)) 
    stop (" 'A' is not a Markov matrix")
  ## direct computation
  b <- A[1, ]
  oldnorm <- sqrt(c(crossprod(b)))
  repeat {
    b <- crossprod(A, b)
    newnorm <- sqrt(c(crossprod(b)))
    if (abs(newnorm / oldnorm - 1) < 1e-8) break
    oldnorm <- newnorm
    }
  ## return stationary distribution
  c(b)
  }

stydis2 (P)
# [1] 0.002590673 0.025906737 0.116580322 0.310880848 0.272020713 0.272020708

我们从一个任意的初始分布开始，比如A[1, ] ，并迭代地应用转移矩阵直到分布收敛。 再次，结果是正确的。

Answer 2

您的向量y = Re(eigen(P)$vectors[, 1])不是分布（因为它加起来不x'P = x一）并且解决P'y = y ，而不是x'P = x 。 您链接的问答中的解决方案大致解决了后者：

x = c(0.00259067357512953, 0.0259067357512953, 0.116580310880829, 
0.310880829015544, 0.272020725388601, 0.272020725388601)
all(abs(x %*% P - x) < 1e-10) # TRUE

通过转置 P，您可以使用特征值方法：

x2 = Re(eigen(t(P))$vectors[, 1])
x2 <- x2/sum(x2) 
(function(x) all(abs(x %*% P - x) < 1e-10))(
  x2
) # TRUE

不过，在这种情况下，它正在寻找不同的平稳向量。

Answer 3

根据平稳概率向量的定义，它是转移概率矩阵的左特征向量，单位特征值为。 我们可以通过计算矩阵的特征分解，识别单位特征值，然后计算每个单位特征值的平稳概率向量来找到这类对象。 这是R一个函数来做到这一点。

stationary <- function(P) {
  
  #Get matrix information
  K     <- nrow(P)
  NAMES <- rownames(P)
  
  #Compute the eigendecomposition
  EIGEN <- eigen(P)
  VALS  <- EIGEN$values
  RVECS <- EIGEN$vectors
  LVECS <- solve(VECS)
  
  #Find the unit eigenvalue(s)
  RES <- zapsmall(Mod(VALS - as.complex(rep(1, K))))
  IND <- which(RES == 0)
  N   <- length(IND)
  
  #Find the stationary vector(s)
  OUT <- matrix(0, nrow = N, ncol = K)
  rownames(OUT) <- sprintf('Stationary[%s]', 1:N)
  colnames(OUT) <- NAMES
  for (i in 1:length(IND)) { 
    SSS     <- Re(eigen(t(P))$vectors[, IND[i]])
    OUT[i,] <- SSS/sum(SSS) }
  
  #Give the output
  OUT }

（注意：使用eigen计算出的eigen分解会受到一些数值误差的影响，因此没有完全等于 1 的特征值。因此，我们将模偏差从 1 中zapsmall以识别单位特征向量。这将给我们只要不存在小于 1 的真实特征值，但又非常接近 1 以致于它也被“zapped”到 1 时，就是正确的答案。）

在这种情况下，将此函数应用于您的转移概率矩阵可以正确识别唯一的平稳概率向量。 计算中存在少量数值误差，但在大多数情况下这应该是可控的。

#Compute the stationary probability vector
S <- stationary(P)

#Show this vector and confirm stationarity
S
                     [,1]       [,2]      [,3]      [,4]      [,5]      [,6]
Stationary[1] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207

S %*% P
                     [,1]       [,2]      [,3]      [,4]      [,5]      [,6]
Stationary[1] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207

#Show error in computation
c(S %*% P - S)
[1]  4.336809e-17  2.775558e-17  1.110223e-16 -2.775558e-16  1.665335e-16 -5.551115e-17

在给定转移概率矩阵的情况下寻找马尔可夫过程的平稳分布

问题描述

3 个解决方案

解决方案1
7 2017-01-12 17:47:52

解决方案2
2 已采纳 2017-01-12 17:44:06

解决方案3
0 2020-10-26 10:02:08

在给定转移概率矩阵的情况下寻找马尔可夫过程的平稳分布

问题描述

3 个解决方案

解决方案1 7 2017-01-12 17:47:52

解决方案2 2 已采纳 2017-01-12 17:44:06

解决方案3 0 2020-10-26 10:02:08

解决方案1
7 2017-01-12 17:47:52

解决方案2
2 已采纳 2017-01-12 17:44:06

解决方案3
0 2020-10-26 10:02:08