繁体   English   中英

这个Python生产者 - 消费者无锁方法是否是线程安全的?

[英]Is this Python producer-consumer lockless approach thread-safe?

我最近编写了一个使用简单生产者/消费者模式的程序。 它最初有一个与不正确使用线程有关的错误。我最终解决了这个问题。 但它让我想到是否有可能以无锁的方式实现生产者/消费者模式。

我的要求很简单:

  • 一个生产者线程。
  • 一个消费者线程。
  • 队列只有一个项目。
  • 生产者可以在消耗当前物品之前生成下一个物品。 因此当前项目丢失了,但这对我来说没问题。
  • 消费者可以在生成下一个项目之前使用当前项目。 因此,当前项目被消耗两次(或更多),但这对我来说没问题。

所以我写了这个:

QUEUE_ITEM = None

# this is executed in one threading.Thread object
def producer():
    global QUEUE_ITEM
    while True:
        i = produce_item()
        QUEUE_ITEM = i

# this is executed in another threading.Thread object
def consumer():
    global QUEUE_ITEM
    while True:
        i = QUEUE_ITEM
        consume_item(i)

我的问题是:这段代码是否是线程安全的?

直接评论:这段代码不是真的无锁 - 我使用CPython并且它有GIL。

我测试了一点代码,它似乎工作。 它转换为一些由于GIL而成为原子的LOAD和STORE操作。 但我也知道,当x实现__del__方法时, del x操作不是原子操作。 因此,如果我的项目有__del__方法并且发生了一些讨厌的调度,那么事情可能会中断。 或不?

另一个问题是:为了使上述代码正常工作,我必须施加什么样的限制(例如生成的项目类型)?

我的问题只是关于利用CPython和GIL的怪癖的理论可能性,以便提出无锁(即没有像代码中明确的threading.Lock这样的锁)解决方案。

诡计会咬你。 只需使用Queue在线程之间进行通信。

是的,这将按照您描述的方式工作:

  1. 生产者可以生产可跳过的元素。
  2. 消费者可能消费相同的元素。

但我也知道,当x实现del方法时,del x操作不是原子的。 因此,如果我的项目有del方法并且发生了一些令人讨厌的调度,那么事情可能会中断。

我在这里看不到“del”。 如果在consume_item中发生del,则del可能出现在生成器线程中。 我不认为这会是一个“问题”。

尽管不要打扰使用它。 您将最终在无意义的轮询周期中耗尽CPU,并且它不会比使用带锁的队列更快,因为Python已经具有全局锁定。

这不是真正的线程安全,因为生产者可以在消费者消费它之前覆盖QUEUE_ITEM ,而消费者可以消耗两次QUEUE_ITEM 正如你所提到的,你没关系,但大多数人都不是。

对cpython内部有更多了解的人将不得不回答你更多的理论问题。

我认为线程在生成/消费时可能会被中断,特别是如果项目是大对象。 编辑:这只是一个疯狂的猜测。 我不是专家。

线程也可以在另一个项开始运行之前产生/消耗任意数量的项。

只要您坚持追加/弹出,就可以使用列表作为队列,因为两者都是原子的。

QUEUE = []

# this is executed in one threading.Thread object
def producer():
    global QUEUE
    while True:
        i = produce_item()
        QUEUE.append(i)

# this is executed in another threading.Thread object
def consumer():
    global QUEUE
    while True:
        try:
            i = QUEUE.pop(0)
        except IndexError:
            # queue is empty
            continue

        consume_item(i)

在如下所示的类范围中,您甚至可以清除队列。

class Atomic(object):
    def __init__(self):
        self.queue = []

    # this is executed in one threading.Thread object
    def producer(self):
        while True:
            i = produce_item()
            self.queue.append(i)

    # this is executed in another threading.Thread object
    def consumer(self):
        while True:
            try:
                i = self.queue.pop(0)
            except IndexError:
                # queue is empty
                continue

            consume_item(i)

    # There's the possibility producer is still working on it's current item.
    def clear_queue(self):
        self.queue = []

您必须通过查看生成的字节码来找出哪些列表操作是原子的。

你说__del__可能是个问题。 这可能是可以避免的,只要有是为了防止垃圾回收器调用的方式__del__旧的对象上的方法我们完成分配新的前QUEUE_ITEM 我们需要这样的东西:

increase the reference counter on the old object
assign a new one to `QUEUE_ITEM`
decrease the reference counter on the old object

我担心,我不知道是否有可能。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM