繁体   English   中英

为什么要避免 Haskell 中的显式递归?

[英]Why to avoid Explicit recursion in Haskell?

我是 Haskell 的新手。

在研究 foldr 时,许多人建议使用它并避免显式递归,这会导致 Memory 代码效率低下。 https://www.reddit.com/r/haskell/comments/1nb80j/proper_use_of_recursion_in_haskell/

当我运行上面链接中提到的示例时。 我可以看到显式递归在 memory 方面做得更好。 首先,我认为可能在 GHCi 上运行并不接近完美的基准,我尝试使用stack ghc编译它。 顺便说一句,我如何通过堆栈 ghc 传递编译器优化标志。 我从 Expression Avoid Explicit Recursion中遗漏了什么。

find p = foldr go Nothing
    where go x rest = if p x then Just x else rest

findRec :: (a -> Bool) -> [a] -> Maybe a
findRec _ [] = Nothing
findRec p (x:xs) = if p x then Just x else (findRec p xs)

main :: IO ()
main = print $ find (\x -> x `mod` 2 == 0) [1, 3..1000000] 
main = print $ findRec (\x -> x `mod` 2 == 0) [1, 3..1000000] 

-- find
Nothing
      92,081,224 bytes allocated in the heap
           9,392 bytes copied during GC
          58,848 bytes maximum residency (2 sample(s))
          26,704 bytes maximum slop
               0 MB total memory in use (0 MB lost due to fragmentation)

                                     Tot time (elapsed)  Avg pause  Max pause
  Gen  0        87 colls,     0 par    0.000s   0.000s     0.0000s    0.0001s
  Gen  1         2 colls,     0 par    0.000s   0.001s     0.0004s    0.0008s

  INIT    time    0.000s  (  0.000s elapsed)
  MUT     time    0.031s  (  0.043s elapsed)
  GC      time    0.000s  (  0.001s elapsed)
  EXIT    time    0.000s  (  0.000s elapsed)
  Total   time    0.031s  (  0.044s elapsed)

  %GC     time       0.0%  (0.0% elapsed)

  Alloc rate    2,946,599,168 bytes per MUT second

  Productivity 100.0% of total user, 96.8% of total elapsed

-- findRec
Nothing
      76,048,432 bytes allocated in the heap
          13,768 bytes copied during GC
          42,928 bytes maximum residency (2 sample(s))
          26,704 bytes maximum slop
               0 MB total memory in use (0 MB lost due to fragmentation)

                                     Tot time (elapsed)  Avg pause  Max pause
  Gen  0        71 colls,     0 par    0.000s   0.000s     0.0000s    0.0001s
  Gen  1         2 colls,     0 par    0.000s   0.001s     0.0004s    0.0007s

  INIT    time    0.000s  (  0.000s elapsed)
  MUT     time    0.031s  (  0.038s elapsed)
  GC      time    0.000s  (  0.001s elapsed)
  EXIT    time    0.000s  (  0.000s elapsed)
  Total   time    0.031s  (  0.039s elapsed)

  %GC     time       0.0%  (0.0% elapsed)

  Alloc rate    2,433,549,824 bytes per MUT second

  Productivity 100.0% of total user, 96.6% of total elapsed

您正在测量 GHC 执行 50 万模运算的速度。 正如您所料,无论您如何迭代,“一眨眼”就是答案。 速度没有明显差异。

您声称您可以看到显式递归使用较少的 memory,但您提供的堆分析数据显示相反:使用显式递归时分配更多和最大驻留。 我认为差异并不显着,但如果是这样,那么您的证据将与您的主张相矛盾。

至于为什么要避免显式递归的问题,目前尚不清楚您阅读的该线程的哪一部分使您得出结论。 你链接到一个巨大的线程,它本身链接到另一个巨大的线程,有许多相互竞争的意见。 对我来说最突出的评论不是关于效率,而是关于抽象级别 通过尝试衡量其性能,您正在以错误的方式看待它。

首先,不要尝试使用优化编译以外的任何方法来了解 GHC 编译代码的性能:

$ stack ghc -- -O2 Find.hs
$ ./Find +RTS -s

使用-O2标志(和 GHC 版本 8.6.4),您的find执行如下:

      16,051,544 bytes allocated in the heap
          14,184 bytes copied during GC
          44,576 bytes maximum residency (2 sample(s))
          29,152 bytes maximum slop
               0 MB total memory in use (0 MB lost due to fragmentation)

然而,这是非常具有误导性的。 这种 memory 的使用都不是由于foldr执行的循环。 相反,这完全是由于使用了盒装Integers 如果您切换到使用编译器可以拆箱的普通Ints

main = print $ find (\x -> x `mod` 2 == 0) [1::Int, 3..1000000]
                                             ^^^^^

memory 性能发生巨大变化,并展示了foldr的真正 memory 成本:

      51,544 bytes allocated in the heap
       3,480 bytes copied during GC
      44,576 bytes maximum residency (1 sample(s))
      25,056 bytes maximum slop
           0 MB total memory in use (0 MB lost due to fragmentation)

如果您像这样使用Ints测试findRec

 main = print $ findRec (\x -> x `mod` 2 == 0) [1::Int, 3..1000000]

您会看到 memory 性能更差:

  40,051,528 bytes allocated in the heap
      14,992 bytes copied during GC
      44,576 bytes maximum residency (2 sample(s))
      29,152 bytes maximum slop
           0 MB total memory in use (0 MB lost due to fragmentation)

这似乎是一个令人信服的案例,应该优先避免递归,而不是foldr ,但这也是非常具有误导性的。 您在这里看到的不是递归的 memory 成本,而是“列表构建”的 memory 成本。

看, foldr和表达式[1::Int, 3..1000000]都包含一些称为“列表融合”的魔法。 这意味着当它们一起使用时(即当foldr应用于[1::Int 3..1000000]时),可以执行优化以完全消除 Haskell 列表的创建。 至关重要的是,即使使用列表融合, foldr代码也会编译为递归代码,如下所示:

main_go
  = \ x ->
      case gtInteger# x lim of {
        __DEFAULT ->
          case eqInteger# (modInteger x lvl) lvl1 of {
            __DEFAULT -> main_go (plusInteger x lvl);
                      -- ^^^^^^^ - SEE?  IT'S JUST RECURSION
            1# -> Just x
          };
        1# -> Nothing
      }
end Rec }

因此,它是列表融合,而不是“避免递归”,它使findfindRec更快。

通过考虑以下性能,您可以看到这是正确的:

find1 :: Int -> Maybe Int
find1 n | n >= 1000000 = Nothing
        | n `mod` 2 == 0 = Just n
        | otherwise = find1 (n+2)

main :: IO ()
main = print $ find1 1

即使这使用递归,它也不会生成列表(或使用装箱的Integers ),因此它就像foldr版本一样运行:

      51,544 bytes allocated in the heap
       3,480 bytes copied during GC
      44,576 bytes maximum residency (1 sample(s))
      25,056 bytes maximum slop
           0 MB total memory in use (0 MB lost due to fragmentation)

那么,带回家的课程有哪些呢?

  • 始终使用ghc -O2对 Haskell 代码进行基准测试,而不是没有优化标志的 GHCi 或ghc
  • 在任何 Reddit 线程中,只有不到 10% 的人知道他们在说什么。
  • 当可以应用列表融合等特殊优化时, foldr有时可以比显式递归执行得更好。
  • 但在一般情况下,显式递归的性能与foldr或其他专用构造一样好。
  • 此外,优化 Haskell 代码也很困难。

实际上,这是一个更好(更严肃)的带回家的课程。 尤其是当您开始使用 Haskell 时,请尽一切可能避免考虑“优化”您的代码。 与我所知道的任何其他语言相比,您编写的代码和编译器生成的代码之间存在巨大的鸿沟,所以现在甚至不要试图弄清楚。 相反,编写清晰、直接和惯用的代码。 如果您现在尝试学习高性能代码的“规则”,那么您将把它们全都弄错了,并且学到了非常糟糕的编程风格。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM