在多處理期間共享大型任意數據結構

Question

我想在 python 中並行化一個需要對幾個大型非數組數據結構進行讀取訪問的進程。 在不將所有大型數據結構復制到每個新進程中的情況下，推薦的方法是什么？

謝謝

Answer 1

multiprocessing 包提供了兩種共享狀態的方式：共享內存對象和服務器進程管理器。 您應該使用服務器進程管理器，因為它們支持任意對象類型。

以下程序使用服務器進程管理器：

#!/usr/bin/env python3

from multiprocessing import Process, Manager

# Simple data structure
class DataStruct:
    data_id = None
    data_str = None
    
    def __init__(self, data_id, data_str):
        self.data_id = data_id
        self.data_str = data_str

    def __str__(self):
        return f"{self.data_str} has ID {self.data_id}"

    def __repr__(self):
        return f"({self.data_id}, {self.data_str})"

    def set_data_id(self, data_id):
        self.data_id = data_id

    def set_data_str(self, data_str):
        self.data_str = data_str

    def get_data_id(self):
        return self.data_id 

    def get_data_str(self):
        return self.data_str


# Create function to manipulate data
def manipulate_data_structs(data_structs, find_str):
    for ds in data_structs:
        if ds.get_data_str() == find_str:
            print(ds)

# Create manager context, modify the data
with Manager() as manager:

    # List of DataStruct objects
    l = manager.list([
        DataStruct(32, "Andrea"),
        DataStruct(45, "Bill"),
        DataStruct(21, "Claire"),
    ])

    # Processes that look for DataStructs with a given String
    procs = [
        Process(target = manipulate_data_structs, args = (l, "Andrea")),
        Process(target = manipulate_data_structs, args = (l, "Claire")),
        Process(target = manipulate_data_structs, args = (l, "David")),
    ]

    for proc in procs:
        proc.start()

    for proc in procs:
        proc.join()

有關更多信息，請參閱文檔中的進程間共享狀態。

在多處理期間共享大型任意數據結構

問題描述

1 個解決方案

解決方案1
-1 2020-10-15 15:44:53

在多處理期間共享大型任意數據結構

問題描述

1 個解決方案

解決方案1 -1 2020-10-15 15:44:53

解決方案1
-1 2020-10-15 15:44:53