[英]Python Multiprocessing returning results with Logging and running frozen on Windows
我需要一些帮助来在多处理和运行 Windows 下冻结的应用程序时实现日志记录。 关于这个主题有几十个主题,我花了很多时间来回顾和测试它们。 我还广泛审查了文档,但我无法弄清楚如何在我的代码中实现这一点。
我创建了一个最小示例,它在 Linux 上运行良好,但在 Windows 上崩溃(即使没有冻结)。 我创建的示例只是我对代码进行的许多迭代之一。
您可以在 github 上找到最小示例。 任何使此示例工作的帮助将不胜感激。
谢谢你。
马克。
在 Linux 上,默认情况下通过fork
方法创建子进程。 这意味着,子进程几乎继承了父进程的所有内容。
在 Windows 上,子进程是通过spawn
方法创建的。 这意味着,子进程几乎从崩溃开始, if __name__ == '__main__'
,则重新导入并重新执行保护云之外的任何代码。
在 Linux 上,由于logger
对象是继承的,您的程序将开始记录。 但它远非完美,因为您直接登录到文件。 由于进程之间的竞争条件,迟早会发生日志行重叠或文件上的IO
错误。
在 Windows 上,由于您没有将logger
对象传递给子进程,并且它重新导入了您的pymp_global
模块,因此logger
是一个None
对象。 因此,当您尝试使用None
对象进行日志记录时,它肯定会崩溃。
使用多处理进行日志记录并不是一件容易的事。 要使其在 Windows 上工作,您必须将记录器对象传递给子进程和/或使用QueueHandler
记录。 另一个类似的进程间通信解决方案是使用SocketHandler
。
这个想法是只有一个线程或进程进行日志记录。 其他进程只发送日志记录。 这可以防止竞争条件并确保在关键进程有时间完成其工作后写出日志。
那么如何实施呢?
我之前遇到过这个日志问题并且已经编写了代码。
您可以将它与logger-tt包一起使用。
#pymp.py
from logging import getLogger
from logger_tt import setup_logging
setup_logging(use_multiprocessing=True)
logger = getLogger(__name__)
# other code below
对于其他模块
#pymp_common.py
from logging import getLogger
logger = getLogger(__name__)
# other code below
这使您无需在任何地方手动编写所有日志记录配置代码。 您可以考虑更改log_config
文件以满足您的需要。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.