Celery 如何用 Python 运行多个任务这么慢？

Question

我的芹菜从 amqp 开始

     -------------- celery@tty-Gazelle-Professional v3.0.19 (Chiastic Slide)
     ---- **** ----- 
     --- * ***  * -- Linux-3.8.0-25-generic-x86_64-with-Ubuntu-13.04-raring
     -- * - **** --- 
     - ** ---------- [config]
     - ** ---------- .> broker:      amqp://guest@localhost:5672//
     - ** ---------- .> app:         proj.celery:0x25ed510
     - ** ---------- .> concurrency: 8 (processes)
     - *** --- * --- .> events:      OFF (enable -E to monitor this worker)
     -- ******* ---- 
     --- ***** ----- [queues]
     -------------- .> celery:      exchange:celery(direct) binding:celery

有一个功能：

    def prime(n):
        .....
        .....
        return number_of_primes_below_n

所以我把这个函数作为 celery 中的一个任务，并与串行计算进行了比较

连续剧：

    [prime(i) for i in xrange(10, 100000)]

与芹菜平行：

    from celery import *
    
    g = group(prime.s(i) for i in xrange(10, 100000))
    res = g.apply_async()

当我 apply_async() 时，在后端，终端屏幕上显示的结果非常快，例如：

[2013-06-20 16:34:56,238: INFO/MainProcess] Task proj.tasks.do_work[989be06b-c4f3-4876-9311-2f5f813857d5] succeeded in 0.0166230201721s: 99640324
[2013-06-20 16:34:56,241: INFO/MainProcess] Task proj.tasks.do_work[6eaa9b85-7ba2-4397-b6ae-cbb5668633d4] succeeded in 0.0123620033264s: 99740169
[2013-06-20 16:34:56,242: INFO/MainProcess] Task proj.tasks.do_work[1f5f6302-94a3-4937-9914-14690d856a5d] succeeded in 0.00850105285645s: 99780121
[2013-06-20 16:34:56,244: INFO/MainProcess] Task proj.tasks.do_work[b3735842-a49c-48a3-8a9e-fab24c0a6c23] succeeded in 0.0102620124817s: 99820081
[2013-06-20 16:34:56,245: INFO/MainProcess] Task proj.tasks.do_work[98eec31a-52eb-4752-92af-6956c0e6f130] succeeded in 0.00973200798035s: 99880036
[2013-06-20 16:34:56,245: INFO/MainProcess] Task proj.tasks.do_work[011a1e99-b307-480b-9765-b1a472dbfa8c] succeeded in 0.0115168094635s: 99800100
[2013-06-20 16:34:56,245: INFO/MainProcess] Task proj.tasks.do_work[f3e3a89f-de79-4ab0-aab7-0a71fe2ab2f7] succeeded in 0.010409116745s: 99840064
[2013-06-20 16:34:56,246: INFO/MainProcess] Task proj.tasks.do_work[61baef04-03c2-4810-bf6a-ae7aa75b80b4] succeeded in 0.0112910270691s: 99860049

但是当我想在芹菜中得到结果时

    res.get()

它运行得非常非常慢，比串行慢得多。 问题是什么？ 是不是因为celery组的获取结果很慢？ 我该如何解决问题？

Answer 1

如果您对 res.get() 操作进行计时，您会注意到（我希望这是真的），这总是大约 500 毫秒。 这是因为AsyncResult.get必须每N毫秒轮询一次结果。 您可以通过为 get, interval提供附加参数来调整它：

res.get(interval=0.005)

您可以在文档和来源中获得更多信息。 请注意，Celery 不是类似 RPC 的通信的最佳解决方案，因为轮询结果会导致性能下降。

我自己的问题

Celery 如何用 Python 运行多个任务这么慢？

问题描述

1 个解决方案

解决方案1
4 已采纳 2013-06-22 05:18:41

Celery 如何用 Python 运行多个任务这么慢？

问题描述

1 个解决方案

解决方案1 4 已采纳 2013-06-22 05:18:41

解决方案1
4 已采纳 2013-06-22 05:18:41