[英]C running slower than PyPy
我正在运行这两个代码。 它们都执行相同的数学过程(最多计算序列值),并且按预期方式产生相同的输出。
但是由于某种原因,PyPy代码的运行速度明显快于C代码。
我不知道为什么会这样,因为我期望C代码运行得更快。
如果有人可以帮助我澄清一下,我将不胜感激(也许有更好的方式编写C代码?)
C代码:
#include <stdio.h>
#include <math.h>
int main()
{
double Sum = 0.0;
long n;
for(n = 2; n < 1000000000; n = n + 1) {
double Sign;
Sign = pow(-1.0, n % 2);
double N;
N = (double) n;
double Sqrt;
Sqrt = sqrt(N);
double InvSqrt;
InvSqrt = 1.0 / Sqrt;
double Ln;
Ln = log(N);
double LnSq;
LnSq = pow(Ln, 2.0);
double Term;
Term = Sign * InvSqrt * LnSq;
Sum = Sum + Term;
}
double Coeff;
Coeff = Sum / 2.0;
printf("%0.14f \n", Coeff);
return 0;
}
PyPy代码(Python的更快实现):
from math import log, sqrt
Sum = 0
for n in range(2, 1000000000):
Sum += ((-1)**(n % 2) * (log(n))**2) / sqrt(n)
print(Sum / 2)
这不足为奇, PyPy
默认情况下会执行许多运行时优化,而C
编译器默认不会执行任何优化。 戴夫·比兹利(Dave Beazley)的2012年PyCon主题演讲非常明确地涵盖了这一点,并提供了对此发生原因的深刻解释。
每所引用的谈话, C
应该超越PyPy
当编译优化级别 2
或3
(你可以看在斐波那契数代在性能上全断面cpython
, pypy
和C
开始在这里 )。
除了编译器的优化级别,您还可以改进代码:
int main()
{
double Sum = 0.0;
long n;
for(n = 2; n < 1000000000; ++n)
{
double N = n; // cast is implicit, only for code readability, no effect on runtime!
double Sqrt = sqrt(N);
//double InvSqrt; // spare that:
//InvSqrt = 1.0/Sqrt; // you spare this division with!
double Ln = log(N);
double LnSq;
//LnSq = pow(Ln,2.0);
LnSq = Ln*Ln; // more efficient
double Term;
//Term = Sign * InvSqrt * LnSq;
Term = LnSq / Sqrt;
if(n % 2)
Term = -Term; // just negating, no multiplication
// (IEEE provided: just one bit inverted)
Sum = Sum + Term;
}
// ...
现在,我们可以进一步简化代码:
int main()
{
double Sum = 0.0;
for(long n = 2; n < 1000000000; ++n)
// ^^^^ possible since C99, better scope, no runtime effect
{
double N = n;
double Ln = log(N);
double Term = Ln * Ln / sqrt(N);
if(n % 2)
Sum -= Term;
else
Sum += Term;
}
// ...
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.