[英]Limiting concurrency and rate for Python threads
给定多个线程,我想将对worker函数的调用速率限制为每秒1个的速率。
我的想法是跟踪所有线程上次调用的时间,并将其与每个线程中的当前时间进行比较。 然后,如果current_time - last_time < rate
。 我让线程睡了一会儿。 我的实现存在问题-我想我可能对锁的工作方式有错误的认识。
我的代码:
from Queue import Queue
from threading import Thread, Lock, RLock
import time
num_worker_threads = 2
rate = 1
q = Queue()
lock = Lock()
last_time = [time.time()]
def do_work(i, idx):
# Do work here, print is just a dummy.
print('Thread: {0}, Item: {1}, Time: {2}'.format(i, idx, time.time()))
def worker(i):
while True:
lock.acquire()
current_time = time.time()
interval = current_time - last_time[0]
last_time[0] = current_time
if interval < rate:
time.sleep(rate - interval)
lock.release()
item = q.get()
do_work(i, item)
q.task_done()
for i in range(num_worker_threads):
t = Thread(target=worker, args=[i])
t.daemon = True
t.start()
for item in xrange(10):
q.put(item)
q.join()
我原本希望每秒看到一次do_work
调用,但是,我同时do_work
收到2个调用(每个线程1个),然后暂停一秒钟。 怎么了?
好的,进行一些编辑。 只是简单地限制将物品放入队列的速度的建议是好的,但是我记得我不得不照顾工人将物品重新添加到队列中的情况。 典型示例:网络任务中的分页或退避重试。 我提出了以下内容。 我猜想对于实际的网络任务,eventlet / gevent库在资源上可能会更容易,但这只是一个例子。 它基本上使用优先级队列来堆积请求,并使用额外的线程以均匀的速率将项目从堆中铲除到实际任务队列中。 我模拟了工人将其重新插入桩中的情况,然后首先对重新插入的物品进行处理。
import sys
import os
import time
import random
from Queue import Queue, PriorityQueue
from threading import Thread
rate = 0.1
def worker(q, q_pile, idx):
while True:
item = q.get()
print("Thread: {0} processed: {1}".format(item[1], idx))
if random.random() > 0.3:
print("Thread: {1} reinserting item: {0}".format(item[1], idx))
q_pile.put((-1 * time.time(), item[1]))
q.task_done()
def schedule(q_pile, q):
while True:
if not q_pile.empty():
print("Items on pile: {0}".format(q_pile.qsize()))
q.put(q_pile.get())
q_pile.task_done()
time.sleep(rate)
def main():
q_pile = PriorityQueue()
q = Queue()
for i in range(5):
t = Thread(target=worker, args=[q, q_pile, i])
t.daemon = True
t.start()
t_schedule = Thread(target=schedule, args=[q_pile, q])
t_schedule.daemon = True
t_schedule.start()
[q_pile.put((-1 * time.time(), i)) for i in range(10)]
q_pile.join()
q.join()
if __name__ == '__main__':
main()
尝试限制多个线程之间的速率对我来说似乎很奇怪。 如果您单独限制每个线程,则可以避免所有的锁定问题。
只是一种猜测,但我想你想设置last_time[0]
到time.time()
未current_time
后) sleep
。
我几乎同时接到2个电话(每个线程1个),然后停一秒钟。 怎么了?
这正是您应该从实现中获得的期望。 假设时间t从0开始,比率为1:
Thread1这样做:
lock.acquire() # both threads wait here, one gets the lock
current_time = time.time() # we start at t=0
interval = current_time - last_time[0] # so interval = 0
last_time[0] = current_time # last_time = t = 0
if interval < rate: # rate = 1 so we sleep
time.sleep(rate - interval) # to t=1
lock.release() # now the other thread wakes up
# it's t=1 and we do the job
Thread2这样做:
lock.acquire() # we get the lock at t=1
current_time = time.time() # still t=1
interval = current_time - last_time[0] # interval = 1
last_time[0] = current_time
if interval < rate: # interval = rate = 1 so we don't sleep
time.sleep(rate - interval)
lock.release()
# both threads start the work around t=1
我的建议是限制将物品放入队列的速度 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.