帶有多個參數的python多重處理

Question

我正在嘗試對一個大文件執行多個操作的函數的多進程處理，但是盡管Im使用partial卻遇到了已知的pickling錯誤。

該函數如下所示：

def process(r,intermediate_file,record_dict,record_id):

    res=0

    record_str = str(record_dict[record_id]).upper()
    start = record_str[0:100]
    end= record_str[len(record_seq)-100:len(record_seq)]

    print sample, record_id
    if r=="1":

        if something:
            res = something...
            intermediate_file.write("...")

        if something:
            res = something
            intermediate_file.write("...")



    if r == "2":
        if something:
            res = something...
            intermediate_file.write("...")

        if something:
            res = something
            intermediate_file.write("...")

    return res

另一個函數中的即時通訊方式如下：

def call_func():
    intermediate_file = open("inter.txt","w")
    record_dict = get_record_dict()                 ### get infos about each record as a dict based on the record_id
    results_dict = {}  
    pool = Pool(10)
    for a in ["a","b","c",...]:

        if not results_dict.has_key(a):
            results_dict[a] = {}

        for b in ["1","2","3",...]:

            if not results_dict[a].has_key(b):
                results_dict[a][b] = {}


            results_dict[a][b]['res'] = []

            infile = open(a+b+".txt","r")
            ...parse the file and return values in a list called "record_ids"...

            ### now call the function based on for each record_id in record_ids
            if b=="1":
                func = partial(process,"1",intermediate_file,record_dict)
                res=pool.map(func, record_ids)
                ## append the results for each pair (a,b) for EACH RECORD in the results_dict 
                results_dict[a][b]['res'].append(res)

            if b=="2":
                func = partial(process,"2",intermediate_file,record_dict)
                res = pool.map(func, record_ids)
                ## append the results for each pair (a,b) for EACH RECORD in the results_dict
                results_dict[a][b]['res'].append(res) 

    ... do something with results_dict...

這個想法是，對於record_ids中的每個記錄，我想保存每對（a，b）的結果。

我不確定是什么給我這個錯誤：

  File "/code/Python/Python-2.7.9/Lib/multiprocessing/pool.py", line 251, in map
    return self.map_async(func, iterable, chunksize).get()
  File "/code/Python/Python-2.7.9/Lib/multiprocessing/pool.py", line 558, in get
    raise self._value
cPickle.PicklingError: Can't pickle <type 'function'>: attribute lookup __builtin__.function faile

d

Answer 1

func不在代碼的頂層定義，因此不能被腌制。 您可以使用pathos.multiprocesssing ，它不是標准模塊，但可以使用。

或者，使用與Pool.map不同的東西，也許是一個工作隊列？ https://docs.python.org/2/library/queue.html

最后有一個您可以使用的示例，它用於threading multiprocessing ，但與multiprocessing非常相似，那里也有隊列...

https://docs.python.org/2/library/multiprocessing.html#pipes-and-queues

帶有多個參數的python多重處理

問題描述

1 個解決方案

解決方案1
0 2016-11-10 09:01:04

帶有多個參數的python多重處理

問題描述

1 個解決方案

解決方案1 0 2016-11-10 09:01:04

解決方案1
0 2016-11-10 09:01:04