[英]Numpy Project Euler 1 Generalized Optimization
我已经开始学习Numpy,并且正在寻找一些编写方法。 我已经写了Euler 1的一般化。它包含一个除数和一个数字的列表,例如Euler 1中的[3,5]和1000。
天真的纯Python:
def subn1(divisors, n):
return sum(i for i in range(1,n) if not all(i % d for d in divisors))
对于range(2,20),1000000,这大约需要2.5秒。
到目前为止,我的第一个也是最好的尝试是这样的:
def subn2(divisors, n):
a = np.arange(1,n)
b = np.zeros(a.shape[0], dtype=bool)
for d in divisors:
b += a % d == 0
return np.sum(a[b])
并且在范围(2,20),1000000的范围内运行约0.45秒。
我的第三次尝试是删除foor循环并使用纯numpy,但是它在速度部门中损失很小,并使用了更多的内存。
def subn3(divisors, n):
nums = np.arange(1,n)
divs = np.array([divisors]).T
return np.sum(nums[np.logical_or.reduce(np.mod(nums, divs) == 0, axis=0)])
对于range(2,20),100000,这大约需要0.5秒。
有没有一种更快的方法可以将其编写为“纯” numpy,或者foor循环不要回避?
注意:我知道您可以通过减少除数列表来优化它,因此无需对此发表评论:)
一种NumPythonic矢量化broadcasting
方法-
def subn_broadcasting(divisors,n):
a = np.arange(1,n)
return (a[(a % np.array(divisors)[:,None] == 0).any(0)]).sum()
运行时测试和验证-
In [14]: # Inputs
...: n = 1000
...: divisors = range(2,20)
...:
In [15]: print subn1(divisors, n)
...: print subn2(divisors, n)
...: print subn3(divisors, n)
...: print subn_broadcasting(divisors, n)
...:
416056
416056
416056
416056
In [16]: %timeit subn1(divisors, n)
...: %timeit subn2(divisors, n)
...: %timeit subn3(divisors, n)
...: %timeit subn_broadcasting(divisors, n)
...:
1000 loops, best of 3: 1.39 ms per loop
1000 loops, best of 3: 480 µs per loop
1000 loops, best of 3: 434 µs per loop
1000 loops, best of 3: 428 µs per loop
嗯,在n2
和n3
版本上似乎没有太大的改进。
您可以使用np.where ,如下所示:
def subn4(divisors, n):
a = np.arange(np.min(divisors),n)
b = np.zeros(a.shape[0], dtype=bool)
for d in divisors:
b += a % d == 0
return np.sum(a[np.where(b)])
def subn4_(divisors, n):
a = np.arange(1,n)
b = np.zeros(a.shape[0], dtype=bool)
for d in divisors:
b += a % d == 0
return np.sum(a[np.where(b)])
测试如之前建议的那样:
%timeit subn1(divisors, n)
%timeit subn2(divisors, n)
%timeit subn3(divisors, n)
%timeit subn_broadcasting(divisors, n)
%timeit subn4(divisors, n)
%timeit subn4_(divisors, n)
1 loops, best of 3: 596 ms per loop
10 loops, best of 3: 30.1 ms per loop
10 loops, best of 3: 32 ms per loop
10 loops, best of 3: 31.9 ms per loop
10 loops, best of 3: 28.2 ms per loop
10 loops, best of 3: 27.4 ms per loop
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.