[英]C - determine if a number is prime
我正在尝试提出一种方法,该方法接受一个整数并返回一个布尔值来说明该数字是否为素数,并且我对 C 了解不多; 有人愿意给我一些指点吗?
基本上,我会在 C# 中这样做:
static bool IsPrime(int number)
{
for (int i = 2; i < number; i++)
{
if (number % i == 0 && i != number)
return false;
}
return true;
}
好吧,所以忘记 C。假设我给你一个数字并让你确定它是否是质数。 你怎么做呢? 清楚地写下这些步骤,然后再担心将它们翻译成代码。
一旦你确定了算法,你就会更容易弄清楚如何编写程序,并让其他人帮助你。
编辑:这是您发布的 C# 代码:
static bool IsPrime(int number) {
for (int i = 2; i < number; i++) {
if (number % i == 0 && i != number) return false;
}
return true;
}
这几乎是有效的 C 语言; C 中没有bool
类型,也没有true
或false
,因此您需要稍微修改它(编辑:Kristopher Johnson 正确指出 C99 添加了 stdbool.h 标头)。 由于有些人无法访问 C99 环境(但您应该使用一个!),让我们做一个非常小的更改:
int IsPrime(int number) {
int i;
for (i=2; i<number; i++) {
if (number % i == 0 && i != number) return 0;
}
return 1;
}
这是一个完全有效的 C 程序,可以执行您想要的操作。 我们可以毫不费力地改进它。 首先,注意i
总是小于number
,所以检查i != number
总是成功; 我们可以摆脱它。
此外,您实际上并不需要一直尝试直到number - 1
除数; 当您到达 sqrt(number) 时,您可以停止检查。 由于sqrt
是一个浮点运算并且带来了一大堆微妙之处,我们实际上不会计算sqrt(number)
。 相反,我们可以检查i*i <= number
:
int IsPrime(int number) {
int i;
for (i=2; i*i<=number; i++) {
if (number % i == 0) return 0;
}
return 1;
}
不过,最后一件事是; 您的原始算法中有一个小错误! 如果number
为负数、零或一,则此函数将声明该数为素数。 您可能希望正确处理它,并且您可能希望使number
无符号,因为您更有可能只关心正值:
int IsPrime(unsigned int number) {
if (number <= 1) return 0; // zero and one are not prime
unsigned int i;
for (i=2; i*i<=number; i++) {
if (number % i == 0) return 0;
}
return 1;
}
这绝对不是检查数字是否为质数的最快方法,但它有效,而且非常简单。 我们几乎不需要修改您的代码!
史蒂芬佳能回答得很好!
但
这比测试所有 m 到 √n 的速度快 3 倍。
int IsPrime(unsigned int number) { if (number <= 3 && number > 1) return 1; // as 2 and 3 are prime else if (number%2==0 || number%3==0) return 0; // check if number is divisible by 2 or 3 else { unsigned int i; for (i=5; i*i<=number; i+=6) { if (number % i == 0 || number%(i + 2) == 0) return 0; } return 1; } }
该程序对于检查单个数字进行素性检查非常有效。
bool check(int n){
if (n <= 3) {
return n > 1;
}
if (n % 2 == 0 || n % 3 == 0) {
return false;
}
int sq=sqrt(n); //include math.h or use i*i<n in for loop
for (int i = 5; i<=sq; i += 6) {
if (n % i == 0 || n % (i + 2) == 0) {
return false;
}
}
return true;
}
检查从 2 到您要检查的数字的根的每个整数的模数。
如果模数为零,则它不是素数。
伪代码:
bool IsPrime(int target)
{
for (i = 2; i <= root(target); i++)
{
if ((target mod i) == 0)
{
return false;
}
}
return true;
}
阅读此问题后,我对某些答案通过运行 2*3=6 的倍数提供优化的事实很感兴趣。
所以我用同样的想法创建了一个新函数,但它是 2*3*5=30 的倍数。
int check235(unsigned long n)
{
unsigned long sq, i;
if(n<=3||n==5)
return n>1;
if(n%2==0 || n%3==0 || n%5==0)
return 0;
if(n<=30)
return checkprime(n); /* use another simplified function */
sq=ceil(sqrt(n));
for(i=7; i<=sq; i+=30)
if (n%i==0 || n%(i+4)==0 || n%(i+6)==0 || n%(i+10)==0 || n%(i+12)==0
|| n%(i+16)==0 || n%(i+22)==0 || n%(i+24)==0)
return 0;
return 1;
}
通过运行这两个函数和检查时间,我可以说这个函数真的更快。 让我们看看有 2 个不同素数的 2 个测试:
$ time ./testprimebool.x 18446744069414584321 0
f(2,3)
Yes, its prime.
real 0m14.090s
user 0m14.096s
sys 0m0.000s
$ time ./testprimebool.x 18446744069414584321 1
f(2,3,5)
Yes, its prime.
real 0m9.961s
user 0m9.964s
sys 0m0.000s
$ time ./testprimebool.x 18446744065119617029 0
f(2,3)
Yes, its prime.
real 0m13.990s
user 0m13.996s
sys 0m0.004s
$ time ./testprimebool.x 18446744065119617029 1
f(2,3,5)
Yes, its prime.
real 0m10.077s
user 0m10.068s
sys 0m0.004s
所以我想,如果概括的话,有人会得到太多吗? 我想出了一个函数,它首先会进行围攻以清除给定的原始素数列表,然后使用这个列表来计算更大的一个。
int checkn(unsigned long n, unsigned long *p, unsigned long t)
{
unsigned long sq, i, j, qt=1, rt=0;
unsigned long *q, *r;
if(n<2)
return 0;
for(i=0; i<t; i++)
{
if(n%p[i]==0)
return 0;
qt*=p[i];
}
qt--;
if(n<=qt)
return checkprime(n); /* use another simplified function */
if((q=calloc(qt, sizeof(unsigned long)))==NULL)
{
perror("q=calloc()");
exit(1);
}
for(i=0; i<t; i++)
for(j=p[i]-2; j<qt; j+=p[i])
q[j]=1;
for(j=0; j<qt; j++)
if(q[j])
rt++;
rt=qt-rt;
if((r=malloc(sizeof(unsigned long)*rt))==NULL)
{
perror("r=malloc()");
exit(1);
}
i=0;
for(j=0; j<qt; j++)
if(!q[j])
r[i++]=j+1;
free(q);
sq=ceil(sqrt(n));
for(i=1; i<=sq; i+=qt+1)
{
if(i!=1 && n%i==0)
return 0;
for(j=0; j<rt; j++)
if(n%(i+r[j])==0)
return 0;
}
return 1;
}
我假设我没有优化代码,但这是公平的。 现在,测试。 由于动态内存太多,我预计列表 2 3 5 会比硬编码的 2 3 5 慢一点。 但是没关系,正如你在下面看到的那样。 在那之后,时间越来越短,最终最好的名单是:
2 3 5 7 11 13 17 19
8.6 秒。 因此,如果有人会创建一个使用这种技术的硬编码程序,我建议使用列表 2 3 和 5,因为收益不是那么大。 而且,如果愿意编码,这个列表是可以的。 问题是你不能在没有循环的情况下陈述所有情况,或者你的代码会非常大(会有 1658879 个ORs
,即在各自的内部if
中是||
)。 下一个列表:
2 3 5 7 11 13 17 19 23
时间开始变长,有 13 秒。 这里是整个测试:
$ time ./testprimebool.x 18446744065119617029 2 3 5
f(2,3,5)
Yes, its prime.
real 0m12.668s
user 0m12.680s
sys 0m0.000s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7
f(2,3,5,7)
Yes, its prime.
real 0m10.889s
user 0m10.900s
sys 0m0.000s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7 11
f(2,3,5,7,11)
Yes, its prime.
real 0m10.021s
user 0m10.028s
sys 0m0.000s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7 11 13
f(2,3,5,7,11,13)
Yes, its prime.
real 0m9.351s
user 0m9.356s
sys 0m0.004s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7 11 13 17
f(2,3,5,7,11,13,17)
Yes, its prime.
real 0m8.802s
user 0m8.800s
sys 0m0.008s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7 11 13 17 19
f(2,3,5,7,11,13,17,19)
Yes, its prime.
real 0m8.614s
user 0m8.564s
sys 0m0.052s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7 11 13 17 19 23
f(2,3,5,7,11,13,17,19,23)
Yes, its prime.
real 0m13.013s
user 0m12.520s
sys 0m0.504s
$ time ./testprimebool.x 18446744065119617029 2 3 5 7 11 13 17 19 23 29
f(2,3,5,7,11,13,17,19,23,29)
q=calloc(): Cannot allocate memory
附注。 我没有故意释放(r),将这个任务交给操作系统,因为一旦程序退出,内存就会被释放,以获得一些时间。 但是如果你打算在计算后继续运行你的代码,那么释放它是明智的。
奖金
int check2357(unsigned long n)
{
unsigned long sq, i;
if(n<=3||n==5||n==7)
return n>1;
if(n%2==0 || n%3==0 || n%5==0 || n%7==0)
return 0;
if(n<=210)
return checkprime(n); /* use another simplified function */
sq=ceil(sqrt(n));
for(i=11; i<=sq; i+=210)
{
if(n%i==0 || n%(i+2)==0 || n%(i+6)==0 || n%(i+8)==0 || n%(i+12)==0 ||
n%(i+18)==0 || n%(i+20)==0 || n%(i+26)==0 || n%(i+30)==0 || n%(i+32)==0 ||
n%(i+36)==0 || n%(i+42)==0 || n%(i+48)==0 || n%(i+50)==0 || n%(i+56)==0 ||
n%(i+60)==0 || n%(i+62)==0 || n%(i+68)==0 || n%(i+72)==0 || n%(i+78)==0 ||
n%(i+86)==0 || n%(i+90)==0 || n%(i+92)==0 || n%(i+96)==0 || n%(i+98)==0 ||
n%(i+102)==0 || n%(i+110)==0 || n%(i+116)==0 || n%(i+120)==0 || n%(i+126)==0 ||
n%(i+128)==0 || n%(i+132)==0 || n%(i+138)==0 || n%(i+140)==0 || n%(i+146)==0 ||
n%(i+152)==0 || n%(i+156)==0 || n%(i+158)==0 || n%(i+162)==0 || n%(i+168)==0 ||
n%(i+170)==0 || n%(i+176)==0 || n%(i+180)==0 || n%(i+182)==0 || n%(i+186)==0 ||
n%(i+188)==0 || n%(i+198)==0)
return 0;
}
return 1;
}
时间:
$ time ./testprimebool.x 18446744065119617029 7
h(2,3,5,7)
Yes, its prime.
real 0m9.123s
user 0m9.132s
sys 0m0.000s
我只想补充一点,没有偶数(第 2 条)可以是质数。 这会导致 for 循环之前的另一个条件。 所以最终代码应该是这样的:
int IsPrime(unsigned int number) {
if (number <= 1) return 0; // zero and one are not prime
if ((number > 2) && ((number % 2) == 0)) return 0; //no even number is prime number (bar 2)
unsigned int i;
for (i=2; i*i<=number; i++) {
if (number % i == 0) return 0;
}
return 1;
}
避免溢出错误
unsigned i, number;
...
for (i=2; i*i<=number; i++) { // Buggy
for (i=2; i*i<=number; i += 2) { // Buggy
// or
for (i=5; i*i<=number; i+=6) { // Buggy
当number
是素数并且i*i
接近类型的最大值时,这些形式是不正确的。
所有整数类型都存在问题,有signed, unsigned
和更宽。
例子:
让UINT_MAX_SQRT
作为最大整数值的平方根的下限。 例如,当unsigned
是 32 位时为 65535。
for (i=2; i*i<=number; i++)
,这个 10 年前的故障发生是因为当UINT_MAX_SQRT*UINT_MAX_SQRT <= number
并且number
是素数时,下一次迭代会导致乘法溢出。 如果类型是有符号类型,则溢出是 UB。 对于unsigned types ,这本身不是 UB,但逻辑已经崩溃。 交互继续,直到截断的乘积超过number
。 可能会出现错误的结果。 使用 32 位unsigned
,尝试 4,294,967,291 这是一个质数。
如果some_integer_type_MAX
是梅森素数,则i*i<=number
永远不会为真。
为避免此错误,请考虑number%i
, number/i
在许多编译器上是有效的,因为商和余数的计算是一起完成的,因此与仅 1 相比,两者都执行不会产生额外成本。
一个简单的全方位解决方案:
bool IsPrime(unsigned number) {
for(unsigned i = 2; i <= number/i; i++){
if(number % i == 0){
return false;
}
}
return number >= 2;
}
int is_prime(int val)
{
int div,square;
if (val==2) return TRUE; /* 2 is prime */
if ((val&1)==0) return FALSE; /* any other even number is not */
div=3;
square=9; /* 3*3 */
while (square<val)
{
if (val % div == 0) return FALSE; /* evenly divisible */
div+=2;
square=div*div;
}
if (square==val) return FALSE;
return TRUE;
}
2 和偶数的处理被排除在只处理奇数除以奇数的主循环之外。 这是因为以偶数为模的奇数将始终给出非零答案,这使得这些测试变得多余。 或者,换句话说,一个奇数可以被另一个奇数整除,但不能被偶数整除(E*E=>E,E*O=>E,O*E=>E 和 O*O =>O)。
尽管成本各不相同,但除法/模数在 x86 架构上的成本确实很高(请参阅http://gmplib.org/~tege/x86-timing.pdf )。 另一方面,乘法非常便宜。
使用埃拉托色尼筛法,与“已知范围”素数算法相比,计算速度要快得多。
通过使用它的 wiki ( https://en.wikipedia.org/wiki/Sieve_of_Eratosthenes ) 中的伪代码,我可以在 C# 上找到解决方案。
public bool IsPrimeNumber(int val) {
// Using Sieve of Eratosthenes.
if (val < 2)
{
return false;
}
// Reserve place for val + 1 and set with true.
var mark = new bool[val + 1];
for(var i = 2; i <= val; i++)
{
mark[i] = true;
}
// Iterate from 2 ... sqrt(val).
for (var i = 2; i <= Math.Sqrt(val); i++)
{
if (mark[i])
{
// Cross out every i-th number in the places after i (all the multiples of i).
for (var j = (i * i); j <= val; j += i)
{
mark[j] = false;
}
}
}
return mark[val];
}
IsPrimeNumber(1000000000) 需要 21 秒 758 毫秒。
注意:值可能因硬件规格而异。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.