繁体   English   中英

有效确定矩阵中[n] [n]个元素的算法

[英]Algorithm to efficiently determine the [n][n] element in a matrix

这是一个关于课程作业的问题,所以宁愿你没有完全回答这个问题,而是提出改进我当前算法的运行时复杂性的技巧。

我收到了以下信息:

函数g(n)由g(n)= f(n,n)给出,其中f可以递归地定义

在此输入图像描述

我用以下代码递归地实现了这个算法:

public static double f(int i, int j) 
{

    if (i == 0 && j == 0) {
        return 0;
    }
    if (i ==0 || j == 0) {
        return 1;
    }

    return ((f(i-1, j)) + (f(i-1, j-1)) + (f(i, j-1)))/3;
}

这个算法给出了我正在寻找的结果,但效率极低,我现在的任务是提高运行时间的复杂性。

我写了一个算法来创建一个n * n矩阵然后计算每个元素直到[n] [n]元素,然后它返回[n] [n]元素,例如f(1,1)将返回0.6重复出现。 [n] [n]元素重复为0.6,因为它是(1 + 0 + 1)/ 3的结果。

我还创建了一个结果从f(0,0)到f(7,7)的电子表格,如下所示:

结果

现在虽然这比我的递归算法快得多,但它创建一个* n矩阵的开销很大。

任何有关如何改进此算法的建议将不胜感激!

我现在可以看到有可能使算法O(n)复杂,但是有可能在不创建[n] [n] 2D数组的情况下计算出结果吗?

我已经在Java中创建了一个在O(n)时间和O(n)空间中运行的解决方案,并且在我递交课程以阻止任何抄袭之后将发布解决方案。

这是另一个问题,在潜入和编写代码之前,最好先检查它。

我要说你应该做的第一件事就是看一下数字的网格,而不是将它们表示为小数,而是表示分数。

首先应该明显的是总数 在此输入图像描述 你只是衡量距起源的距离, 在此输入图像描述

如果以这种方式查看网格,您可以获得所有分母:

在此输入图像描述

请注意,第一行和第一行不是全部1秒 - 它们已被选择为遵循模式,并且通用公式适用于所有其他正方形。

分子有点棘手,但仍然可行。 与大多数这样的问题一样,答案与组合,阶乘,然后是一些更复杂的事情有关。 这里的典型条目包括加泰罗尼亚数字斯特林数字Pascal三角形 ,您几乎总会看到使用的超几何函数

除非你做了很多数学,否则你不太可能熟悉所有这些,而且还有很多文献。 所以我有一个更简单的方法来找出你需要的关系,这几乎总是有效的。 它是这样的:

  1. 写一个天真的,低效的算法来获得你想要的序列。
  2. 将相当大量的数字复制到谷歌中。
  3. 希望弹出整个在线百科全书序列的结果。

    3.B. 如果没有,那么请查看序列中的一些差异,或者与数据相关的其他序列。

  4. 使用您找到的信息来实现所述序列。

所以,遵循这个逻辑,这里是分子:

在此输入图像描述

不幸的是,现在谷歌搜索没有产生任何东西。 但是,有一些事情你可以注意到它们,主要是第一行/列只是3的幂,第二行/列比3的幂少一个。 这种边界与Pascal的三角形和许多相关的序列完全相同。

这是分子和分母之间的差异矩阵:

在此输入图像描述

我们已经确定f(0,0)元素应该遵循相同的模式。 这些数字看起来已经简单得多了。 还要注意 - 相当有趣的是,这些数字遵循与初始数字相同的规则 - 除了第一个数字是一个(并且它们被列和行偏移)。 T(i,j) = T(i-1,j) + T(i,j-1) + 3*T(i-1,j-1)

                     1 
                  1     1
               1     5     1
            1     9     9     1
         1     13    33    13    1
      1     17    73    73    17    1
   1     21    129   245   192   21    1
1     25    201   593   593   201   25    1

这看起来更像是你在组合学中看到很多的序列。

如果您使用此矩阵中的Google数字,则会受到影响。

然后,如果切断原始数据的链接,就会得到序列A081578 ,它被描述为“Pascal-(1,3,1)数组”,这完全有意义 - 如果你旋转矩阵,那么0,0元素位于顶部,元素形成一个三角形,然后你得到1*左元素, 3*上面的元素, 1*右元素。

现在的问题是实现用于生成数字的公式。

不幸的是,这说起来容易做起来难。 例如,页面上给出的公式:

T(n,k)= sum {j = 0..n,C(k,jk)* C(n + kj,k)* 3 ^(jk)}

这是错误的,需要花一点时间阅读论文 (链接在页面上)来计算出正确的公式。 你想要的部分是命题26,推论28.在命题13之后的表2中提到了序列。注意r=4

在命题26中给出了正确的公式,但在那里也有一个错字:/。 总和中的k=0应为j=0

在此输入图像描述

其中T是包含系数的三角矩阵。

OEIS页面确实提供了几个实现来计算数字,但它们都不在java中,并且它们都不能轻易转录为java:

有一个mathematica示例:

Table[ Hypergeometric2F1[-k, k-n, 1, 4], {n, 0, 10}, {k, 0, n}] // Flatten 

一如既往,这是荒谬的简洁。 还有一个Haskell版本,同样简洁:

a081578 n k = a081578_tabl !! n !! k
a081578_row n = a081578_tabl !! n
a081578_tabl = map fst $ iterate
   (\(us, vs) -> (vs, zipWith (+) (map (* 3) ([0] ++ us ++ [0])) $
                      zipWith (+) ([0] ++ vs) (vs ++ [0]))) ([1], [1, 1])

我知道你在java中这样做了,但是我无法将我的答案转录成java(对不起)。 这是一个python实现:

from __future__ import division
import math

#
# Helper functions
#

def cache(function):
  cachedResults = {}
  def wrapper(*args):
    if args in cachedResults:
      return cachedResults[args]
    else:
      result = function(*args)
      cachedResults[args] = result
      return result
  return wrapper


@cache
def fact(n):
 return math.factorial(n)

@cache
def binomial(n,k):
  if n < k: return 0
  return fact(n) / ( fact(k) * fact(n-k) )





def numerator(i,j):
  """
  Naive way to calculate numerator
  """
  if i == j == 0:
    return 0
  elif i == 0 or j == 0:
    return 3**(max(i,j)-1)
  else:
    return numerator(i-1,j) + numerator(i,j-1) + 3*numerator(i-1,j-1)

def denominator(i,j):
  return 3**(i+j-1)



def A081578(n,k):
  """
  http://oeis.org/A081578
  """
  total = 0
  for j in range(n-k+1):
    total += binomial(k, j) * binomial(n-k, j) * 4**(j)
  return int(total)

def diff(i,j):
  """
  Difference between the numerator, and the denominator. 
  Answer will then be 1-diff/denom.
  """
  if i == j == 0:
    return 1/3
  elif i==0 or j==0:
    return 0
  else:
    return A081578(j+i-2,i-1)

def answer(i,j):
  return 1 - diff(i,j) / denominator(i,j)




# And a little bit at the end to demonstrate it works.
N, M = 10,10

for i in range(N):
  row = "%10.5f"*M % tuple([numerator(i,j)/denominator(i,j) for j in range(M)])
  print row

print ""
for i in range(N):
  row = "%10.5f"*M % tuple([answer(i,j) for j in range(M)])
  print row

因此,对于封闭形式:

在此输入图像描述

在哪里 在此输入图像描述 只是二项式系数。

这是结果:

在此输入图像描述

最后一个补充,如果你想要为大数字做这个,那么你将需要以不同的方式计算二项式系数,因为你将溢出整数。 你的答案虽然是浮动点,但由于你显然对大f(n) = T(n,n)感兴趣,我想你可以使用斯特林的近似值。

对于初学者来说,这里有一些要记住的事情:

这种情况只能发生一次,但每次循环都会测试它。

if (x == 0 && y == 0) {
    matrix[x][y] = 0;
}

你应该改为: matrix[0][0] = 0; 在您进入第一个循环并将x设置为1之前。因为您知道x永远不会为0,您可以删除第二个条件的第一部分x == 0

for(int x = 1; x <= i; x++)
        {
            for(int y = 0; y <= j; y++)
            {             
                if (y == 0) {
                    matrix[x][y] = 1;
                }
                else
                matrix[x][y] = (matrix[x-1][y] + matrix[x-1][y-1] + matrix[x][y-1])/3;
            }
        }

声明行和列没有意义,因为你只使用它一次。 double[][] matrix = new double[i+1][j+1];

为了描述时间复杂度,我们通常使用大O符号。 重要的是要记住它只描述了输入时的增长。 O(n)是线性时间复杂度,但它没有说明当我们增加输入时,时间增长的速度有多快(或缓慢)。 例如:

n=3 -> 30 seconds
n=4 -> 40 seconds
n=5 -> 50 seconds

这是O(n),我们可以清楚地看到n的每次增加都会使时间增加10秒。

n=3 -> 60 seconds
n=4 -> 80 seconds
n=5 -> 100 seconds

这也是O(n),即使每n需要两倍的时间,并且每增加n的时间增加20秒,时间复杂度线性增长。

因此,如果你有O(n * n)时间复杂度并且你将执行的操作数量减半,你将获得等于O(n * n)的O(0.5 * n * n) - 即你的时间复杂度赢了不要改变。

这是理论,在实践中,操作的数量有时会产生影响。 因为你有一个网格n乘n,你需要填充n * n个单元格,所以你可以实现的最佳时间复杂度是O(n * n),但是你可以做一些优化:

  • 网格边缘上的单元可以填充在单独的循环中。 目前在大多数情况下,你有两个不必要的条件,i和j等于0。
  • 你的网格有一条对称线,你可以用它来计算它的一半,然后将结果复制到另一半。 对于每个i和j grid[i][j] = grid[j][i]

最后需要注意的是,代码的清晰度和可读性比性能要重要得多 - 如果您可以阅读并理解代码,则可以对其进行更改,但如果代码太难以让您无法理解,则无法对其进行优化。 这就是为什么我只做第一次优化(它也增加了可读性),但不会做第二次 - 它会使代码更难理解。

根据经验,不要优化代码,除非性能确实导致问题。 正如威廉沃尔夫所说:

更多的计算罪是以效率的名义(不一定实现它)而不是任何其他单一原因 - 包括盲目的愚蠢。

编辑:

我认为有可能以O(1)复杂度实现此功能。 虽然当您需要填充整个网格时它没有任何好处,但是O(1)时间复杂度可以立即获得任何值而无需网格。

格

一些观察:

  • 分母等于3 ^ (i + j - 1)
  • 如果i = 2或j = 2,则分子小于分母

编辑2:

分子可以用以下函数表示:

public static int n(int i, int j) {
    if (i == 1 || j == 1) {
        return 1;
    } else {
        return 3 * n(i - 1, j - 1) + n(i - 1, j) + n(i, j - 1);
    }
}

与原始问题非常相似,但没有除法,所有数字都是整数。

该算法的最小复杂度为Ω(n)因为您只需要将矩阵的第一列和第一行中的值与某些因子相乘,然后将它们相加。 这些因素源于解散递归n次。

但是,您需要进行递归的展开。 它本身具有O(n^2)的复杂性。 但是通过平衡展开的展开和评估,您应该能够将复杂度降低到O(n^x) ,其中1 <= x <= 2 这与矩阵 - 矩阵乘法算法类似,其中朴素情况具有O(n^3)的复杂度,但Strassens的算法例如是O(n^2.807)

另一点是原始公式使用1/3的因子。 由于这不能通过固定点数或ieee 754浮点精确表示,因此在连续评估递归时误差会增加。 因此,展开递归可以提供更高的准确性作为一个很好的副作用。

例如,当你展开递归sqr(n)次时,你有复杂度O((sqr(n))^2+(n/sqr(n))^2) 第一部分用于展开,第二部分用于评估大小为n/sqr(n)的新矩阵。 新的复杂性实际上可以简化为O(n)

如果问题是关于如何输出函数的所有值0<=i<N0<=j<N ,这里是时间O(N²)和空间O(N) 时间行为是最佳的。

Use a temporary array T of N numbers and set it to all ones, except for the first element.

Then row by row,

    use a temporary element TT and set it to 1,
    then column by column, assign simultaneously T[I-1], TT = TT, (TT + T[I-1] + T[I])/3.

感谢will(第一)的回答,我有这个想法:

考虑到任何正解从只配备1沿的xy轴。 f每个递归调用将解决方案的每个组成部分除以3,这意味着我们可以组合地总结每个1作为解决方案组件的特征方式,并将其视为“距离”(测量为多少个调用f它来自目标)作为3的负幂。

JavaScript代码:

function f(n){

  var result = 0;

  for (var d=n; d<2*n; d++){

    var temp = 0;

    for (var NE=0; NE<2*n-d; NE++){

      temp += choose(n,NE);
    }

    result += choose(d - 1,d - n) * temp / Math.pow(3,d);
  }

  return 2 * result;
 }

function choose(n,k){
  if (k == 0 || n == k){
    return 1;
  }
  var product = n;
  for (var i=2; i<=k; i++){
    product *= (n + 1 - i) / i
  }
  return product;
}

输出:

for (var i=1; i<8; i++){
  console.log("F(" + i + "," + i + ") = " + f(i));
}

F(1,1) = 0.6666666666666666
F(2,2) = 0.8148148148148148
F(3,3) = 0.8641975308641975
F(4,4) = 0.8879743941472337
F(5,5) = 0.9024030889600163
F(6,6) = 0.9123609205913732
F(7,7) = 0.9197747256986194

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM