簡體   English   中英

C ++中的隨機數生成…第一個數字不是非常隨機

[英]random number generation in C++ … first number not very random

我試圖在不使用boost的情況下在C ++中獲得0到1之間的統一隨機數。 我不想依靠圖書館。

每當我啟動程序時,我都會用srand(time(NULL));作為種子。

然后我打印8個隨機數。 我用空白行分隔了程序的不同運行:

Random number: 0.226063
Random number: 0.449186
Random number: 0.474514
Random number: 0.160779
Random number: 0.220868
Random number: 0.136685
Random number: 0.260120
Random number: 0.843334

Random number: 0.226181
Random number: 0.422253
Random number: 0.808594
Random number: 0.040531
Random number: 0.212377
Random number: 0.421073
Random number: 0.965790
Random number: 0.026305

Random number: 0.226306
Random number: 0.526858
Random number: 0.898279
Random number: 0.378934
Random number: 0.736653
Random number: 0.924420
Random number: 0.718503
Random number: 0.888140

Random number: 0.226463
Random number: 0.157614
Random number: 0.010386
Random number: 0.551936
Random number: 0.391998
Random number: 0.303603
Random number: 0.659396
Random number: 0.465434

為什么第一個數字每次都幾乎完全相同? 我不明白 我應該扔掉第一個數字還是什么?


樣例代碼:

#include <iostream>

int main() {
  srand( time(NULL) );
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
  printf("%f\n", (float)rand()/RAND_MAX);
}

不, 不要扔掉第一個。 這會使結果產生偏差。 盡管人類傾向於嘗試在所有事物中尋找意義,但序列{1,1,1,1,1,1,1}出現可能性與其他任意七數序列完全一樣

嘗試擺弄它是因為您不喜歡該序列,這會使隨機數生成變得更糟,而不是更好。

對於它的價值,您應該確保運行間隔至少相差一秒,因此您不會使用相同的種子(此處似乎不是這種情況)。 除此之外,請使用PRNG 原樣提供的結果或找到更好的生成器。

您是統計學家/密碼​​學家,在這里您將不會使用普通的隨機函數,或者那真的沒關系! 絕大多數情況下都是后者。


如果您不希望花哨的東西(或涉及大量額外東西的東西),而對實現中提供的東西不滿意,則可以很容易地基於gcc版本實現一個東西,例如:

seed = (1103515245 * seed + 12345) & 0xffffffff
return seed & 0x7fffffff

並且請記住,初始種子值是根據提供給srand的模量為2 31 -1的參數計算的,以最小化與初始種子具有線性相關性的序列(序列仍然具有線性,只是不是來自初始種子值)。

如果您只是在尋找快速解決方案而不依賴於外部庫或花費時間實現更復雜的生成器,那么以下代碼可能會使您的生活更輕松:

// Assume 32-bit integer.
static int seed = 1;
void mySRand (int newseed) {
    seed = newseed % 0x7fffffff;
}
int myRand() {
    seed = 1103515245 * seed + 12345;
    return seed & 0x7fffffff;
}

下面的程序實際上將使您了解該算法將對提供給mySRand的種子值進行很小的更改會做什么。

它從time (NULL)獲取初始種子time (NULL)然后向您顯示myRand中20個連續種子值的初始值以及百分比變化。

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>

static int seed = 1;
void mySRand (int newseed) { seed = newseed % 0x7fffffff; }
int myRand() { seed = 1103515245 * seed + 12345; return seed & 0x7fffffff; }

int main (void) {
    int i, xyzzy, val, lastVal;
    double avg, diff;
    xyzzy = time (NULL);
    mySRand (xyzzy);
    lastVal = myRand();
    printf ("seed=%d, val=%12d\n", xyzzy, lastVal);
    for (i = 0; i < 20; i++) {
        mySRand (++xyzzy);
        val = myRand();
        avg = val; avg = (avg + lastVal) / 2;
        diff = 100 * fabs (avg - val) / avg;
        printf ("seed=%d, val=%12d, avg=%12.1f, %%chg=%f\n",
            xyzzy, val, avg, diff);
        lastVal = val;
    }
    return 0;
}

百分比變化基於當前值與當前值與先前值之間的平均值之差,從而希望不會引入偏差。 樣本輸出為:

seed=1324533721, val=  1092183454
seed=1324533722, val=    48215051, avg= 570199252.5, %chg=91.544175
seed=1324533723, val=  1151730296, avg= 599972673.5, %chg=91.963792
seed=1324533724, val=   107761893, avg= 629746094.5, %chg=82.888041
seed=1324533725, val=  1211277138, avg= 659519515.5, %chg=83.660545
seed=1324533726, val=   167308735, avg= 689292936.5, %chg=75.727484
seed=1324533727, val=  1270823980, avg= 719066357.5, %chg=76.732504
seed=1324533728, val=   226855577, avg= 748839778.5, %chg=69.705726
seed=1324533729, val=  1330370822, avg= 778613199.5, %chg=70.864150
seed=1324533730, val=   286402419, avg= 808386620.5, %chg=64.571108
seed=1324533731, val=  1389917664, avg= 838160041.5, %chg=65.829626
seed=1324533732, val=   345949261, avg= 867933462.5, %chg=60.141039
seed=1324533733, val=  1449464506, avg= 897706883.5, %chg=61.463005
seed=1324533734, val=   405496103, avg= 927480304.5, %chg=56.279815
seed=1324533735, val=  1509011348, avg= 957253725.5, %chg=57.639642
seed=1324533736, val=   465042945, avg= 987027146.5, %chg=52.884483
seed=1324533737, val=  1568558190, avg=1016800567.5, %chg=54.264095
seed=1324533738, val=   524589787, avg=1046573988.5, %chg=49.875518
seed=1324533739, val=  1628105032, avg=1076347409.5, %chg=51.262038
seed=1324533740, val=   584136629, avg=1106120830.5, %chg=47.190523
seed=1324533741, val=  1687651874, avg=1135894251.5, %chg=48.574735

因此您可以看到,基於彼此靠近的初始種子,起始值實際上存在很大差異。

您可以使用標准庫,該庫提供高質量的PRNG引擎以及適當的分發適配器:

#include <random>

typedef std::mt19937 rng_type;
std::uniform_real_distribution<double> u01dist;

rng_type rng;

int main()
{
  rng.seed(std::time(NULL));

  double random_number = u01dist(rng);

  // ...
}

完全正常。 PRNG必須預熱 我腦海中的數字大約是1000。這意味着,在將PRNG播種后,得到1000個數字並將其丟棄。

原因是大多數生成器是如何實現的。 它們通常類似於x = a*x+b ,其中ab是常數。 因此,如果您不走運,則選擇您的種子(在您的情況下非常接近!),以便等式的第一部分與結果沒有太大關系(即接近0(mod MAX_RAND))。 這就是為什么必須熱身:它消除了所選種子的相似性。 聽起來很愚蠢,但這就是PRNG的工作方式(您可能會舍棄50個YMMV而不是1000個)。


順便說一句,使用rand通常是一個可怕的想法。 與其他PRNG相比,這不僅很慢(出於誠實的原因),而且生成的數字也很差(就熵,周期性等而言)。 如果您不想使用boost,也許可以使用gsl,它具有幾乎所有您需要的東西(關於隨機數)。

也許程序執行之間的延遲太短了,所以時間函數可能返回彼此太相似的種子。

在不知道srand函數如何實現的情況下很難確定,但它是一個偽隨機數生成器,它將為相同的種子輸出相同的序列以進行多次執行。 嘗試在彼此之間延遲較大的情況下喂入種子,或者在time函數返回的時間上添加變量padding,看看這是否對輸出有足夠的影響。 但是,請注意它們不是真正的隨機數。

當我稍微調整一下示例以使其在使用C進行編譯時可以運行時(我不十分了解C ++以至於在不咒罵的情況下修復編譯錯誤)我只看到隨機的第一行:

$ while true ; do sleep 1 ; ./rand | head -1 ; done
0.493923
0.353780
0.217848
0.570592
0.430408
0.290481
0.651497
0.006394
0.865017
0.721335
0.581914
0.936602
0.796496
^C

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM