Python和多线程

Question

python incref是这样定义的

#define Py_INCREF(op) (                         \
    _Py_INC_REFTOTAL  _Py_REF_DEBUG_COMMA       \
    ((PyObject *)(op))->ob_refcnt++)

对于多核，增量仅是L1高速缓存，不会刷新到内存。

如果两个线程同时在不同的内核中增加该引用，而没有刷新到实际内存，那么对我来说，可能会丢失一个增量。 -ob_refcnt = 1-核心1的L1高速缓存中的核心1增量，但不刷新=> ob_refcnt = 2-核心2的L1高速缓存中的核心2增量，但不刷新=> ob_refcnt = 2-WTF

使用多核或多进程有风险吗？

PyObject的声明如下：

typedef struct _object {
    _PyObject_HEAD_EXTRA
    Py_ssize_t ob_refcnt;
    struct _typeobject *ob_type;
} PyObject

但是Py_ssize_t只是ssize_t或intptr_t。

似乎未使用_Py_atomic *函数和属性。

Python如何管理这种情况？ 如何刷新线程之间的缓存？

Answer 1

Python的CPython实现具有全局解释器锁（GIL）。 调用大多数Python C API函数（包括Py_INCREF ）而不持有此锁是未定义的行为，几乎可以肯定会导致数据不一致或程序崩溃。

可以按照文档中的说明释放和获取 GIL。

由于需要持有此锁才能在Python对象上进行操作，因此Python中的多线程非常有限，并且唯一能够并行化的操作是诸如在大型数组上等待IO或纯C计算之类的事情。 multiprocessing模块（启动隔离的Python进程）是并行Python的另一个选项。

已经尝试使用原子类型进行引用计数（以消除/最小化对GIL的需求），但是这些操作导致单线程代码的显着减慢，因此被放弃了。

Answer 2

为什么不使用Python的Lock或Semaphore？ https://docs.python.org/2/library/threading.html

Python和多线程

问题描述

2 个解决方案

解决方案1
6 已采纳 2018-02-14 16:14:07

解决方案2
0 2018-02-21 09:05:59

Python和多线程

问题描述

2 个解决方案

解决方案1 6 已采纳 2018-02-14 16:14:07

解决方案2 0 2018-02-21 09:05:59

解决方案1
6 已采纳 2018-02-14 16:14:07

解决方案2
0 2018-02-21 09:05:59