[英]pool.apply_async with multiple parameters
以下代码应同时调用两个数据库。 我试图用ThreadPool做到这一点,但遇到了一些困难。 pool.apply_async似乎不允许使用多个参数,因此我将它们放入一个元组中,然后尝试对其进行解压缩。 这是正确的方法还是有更好的解决方案?
元组列表在params = ...中定义,元组有3个条目。 我希望函数被调用两次,每次带有3个参数。
def get_sql(self, *params): # run with risk
self.logger.info(len(params))
sql=params[0]
schema=params[1]
db=params[2]
self.logger.info("Running SQL with schema: {0}".format(schema))
df = pd.read_sql(sql, db)
return df
def compare_prod_uat(self):
self.connect_dbrs_prod_db()
self.connect_dbrs_uat_db()
self.logger.info("connected to UAT and PROD database")
sql = """ SELECT * FROM TABLE """
params = [(sql, "DF_RISK_PRD_OWNER", self.db_dbrs_prod), (sql, "DF_RISK_CUAT_OWNER", self.db_dbrs_uat)]
pool = ThreadPool(processes=2)
self.logger.info("Calling Pool")
result_prod = pool.apply_async(self.get_sql, (sql, "DF_RISK_PRD_OWNER", self.db_dbrs_prod))
result_uat = pool.apply_async(self.get_sql, (sql, "DF_RISK_CUAT_OWNER", self.db_dbrs_uat))
# df_prod = self.get_sql(sql, "DF_RISK_PRD_OWNER", self.db_dbrs_prod)
# df_cuat = self.get_sql(sql, "DF_RISK_CUAT_OWNER", self.db_dbrs_uat)
self.logger.info("Get return from uat")
df1 = result_uat.get() # get return value from the database call
self.logger.info("Get return from prod")
df2 = result_prod.get() # get second return value from the database call
return df1, df2
可能有很多错误,但是如果您添加
print params
作为get_sql的第一行,您会看到发送了一个元组(sql,[(sql,“ DF_RISK_PRD_OWNER”,self.db_dbrs_prod),(sql,.....]])
所以是的,params的长度始终是两个,第一个参数是“ sql”,无论实现中是什么,第二个参数是长度为三的元组数组。 我不明白为什么要发送(sql,params)而不是仅发送(params,),因为“ sql”似乎存在于数组元素中。 如果需要放在那里,则您的数组位于params [1]中。
但是,我不明白您的辅助函数将如何遍历此数组。 它似乎只执行一个sql语句,因为它没有for循环。 也许您打算在compare_prod_uat函数中执行for循环,并生成与数组中元素数量一样多的worker? 我不知道,但是目前没有多大意义。
但是,可以通过此方法解决参数问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.