繁体 English 中英

在 Python C 扩展中使用来自 PyObjects 的数据而不持有 GIL

[英]using data from PyObjects in Python C Extension without holding the GIL

原文 2021-02-27 16:48:53 7 1 python/ python-3.x/ python-c-api

在我的 Python C 扩展中，我正在对字符串的可迭代执行操作。 因此，在第一步中，我调用PySequence_Fast将其转换为列表，然后遍历元素。 对于每个字符串，我使用PyUnicode_DATA然后使用一些标准比较字符串。 所以我只从 PyObjects 中读取，但从不修改它们。

现在我想并行处理列表，这需要我释放 GIL。 但是我不知道这对我的用例有什么影响。 以下是我目前的想法：

我仍然可以使用这些 API，因为它们只是宏，可以直接从 PyObjects 读取而不修改它们。
我必须事先使用 API 并存储一个结构数组，这些结构包含字符串的kind 、 length和data pointer
我必须事先使用 API，并且必须将字符串的副本存储在数组中

案例 1 的性能最高，memory 效率最高。 但是，如果没有获得 GIL，则不允许在 Python 对象上执行（这是否包括读取权限）或使用 Python/C API 函数。

案例 2 将是下一个最有效的，因为至少我不必复制所有字符串。 但是，当我在 GIL 被释放时不允许从 Python 对象中读取时，我想知道是否允许我使用指向 PyObject 内部数据的指针。

案例 3 将要求我复制所有字符串。 就我而言，这可能会使多线程解决方案比顺序解决方案慢。

我希望有人能帮助我了解在 GIL 发布期间我可以做什么。

1 个解决方案

我认为官方的回答是你不应该使用方法 1，而应该使用方法 2 和 3。虽然它现在可能有效，但将来可能会发生变化并中断。 如果您想支持 PyPy 的 C-API 包装器（它很可能在内部使用与 Python 不同的表示）之类的东西，这一点尤其重要。 有越来越多的举措试图隐藏您可能会被抓住的实施细节。

实际上，我认为方法 1 可以正常工作，前提是您只使用没有错误检查的宏 forms - GIL 主要是关于停止同时写入将 Python 对象放在未定义的 Z9ED39E2EA931586B6A985A6942EF5 中，并且您正在这样做。 我要稍微小心的是，如果您曾经拥有（已弃用）“非规范”unicode 对象 - 看起来像PyUnicode_READY之类的“宏-y”对象可能会导致它们被修改为规范 state。 同样，要特别警惕 C-API 的替代（非 CPython）实现。

要考虑的一种替代方法是使用缓冲区协议。 虽然我在文档中找不到明确说明，但想法是PyObject_GetBuffer和PyBuffer_Release需要 GIL，但读/写缓冲区不需要。 这里我有两个子建议：

你能有一个像 Numpy 数组一样的 object 数组，它将所有字符串作为缓冲区公开吗？
您还可以从 unicode object （作为 utf-8 C 字符串）获取缓冲区 - 要做的事情是使用 GIL 创建所有缓冲区，并使用 GIL 进行免费处理。 这样做的开销可能是低效的。 这基本上是方法 2 的“官方”版本。

我简短地说，你可能会侥幸逃脱，但如果它打破了，我怀疑向 Python 的错误报告会受到好评（因为它在技术上是错误的）

Numpy C扩展：访问PyArrayObject中的PyObject

[英]Numpy C extension: Access PyObjects in a PyArrayObject

Python：在没有GIL的情况下绘制一些数据（matplotlib）

[英]Python: Plot some data (matplotlib) without GIL

没有 GIL 就不允许来自 Python 的强制

[英]Coercion from Python not allowed without the GIL

致命的 Python 错误：_PyMem_DebugMalloc: Python memory 分配器调用时不持有 GIL

[英]Fatal Python error: _PyMem_DebugMalloc: Python memory allocator called without holding the GIL

OpenMP，Python，C扩展，内存访问和邪恶的GIL

[英]OpenMP, Python, C Extension, Memory Access and the evil GIL

在没有 GIL 的情况下不允许来自 Python 的强制，并行使用 arrays（Cython 中的多线程）

[英]Coercion from Python not allowed without the GIL, using arrays in parallel (multithreading in Cython)

Cython错误：没有GIL就不允许来自Python的强制

[英]Cython error: Coercion from Python not allowed without the GIL

从C ++线程调用python脚本，GIL

[英]call python script from C++ threads, GIL

从 C++ 函数调用 python lambda 时处理 GIL

[英]Handling GIL when calling python lambda from C++ function

Python C API：将PyObjects分配给字典会导致内存泄漏

[英]Python C API: Assigning PyObjects to a dictionary causes memory leak

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Numpy C扩展：访问PyArrayObject中的PyObject Python：在没有GIL的情况下绘制一些数据（matplotlib）没有 GIL 就不允许来自 Python 的强制致命的 Python 错误：_PyMem_DebugMalloc: Python memory 分配器调用时不持有 GIL OpenMP，Python，C扩展，内存访问和邪恶的GIL 在没有 GIL 的情况下不允许来自 Python 的强制，并行使用 arrays（Cython 中的多线程） Cython错误：没有GIL就不允许来自Python的强制从C ++线程调用python脚本，GIL 从 C++ 函数调用 python lambda 时处理 GIL Python C API：将PyObjects分配给字典会导致内存泄漏

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM