繁体   English   中英

如何使用多线程/多处理代替 For 循环与 pandas dataframe

[英]How to use multithreading / multiprocessing in place of For loop with pandas dataframe

目前,我在一个项目中,根据 dataframe 行中提供的数据执行验证,所以我目前的方法是执行验证的顺序方法。

for index in mt.index():
    #File Reading 
    #performing validation

但我想实现多线程/多处理以提高我在当前方法中的处理时间,这将花费比预期更多的时间。 任何人都可以建议或帮助我如何实现增强我的脚本性能的多线程/多处理。

您可以使用池 API:

from multiprocessing import Pool

p = Pool()

def validate(index):
   ## do validation work for a given index here

result = p.map(validate, mt.index())

map function 将在mt.index()的值上并行化循环。 查看这些文档以获取更多选项。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM