c++ - 機器精度以及雙精度類型的最大值和最小值

厄普西隆

Epsilon是可以加到1.0並產生與1.0明顯不同的結果的最小值。 正如Poita_暗示的那樣，這對於處理舍入錯誤很有用。 這種情況非常簡單：普通浮點數的精度無論其大小如何都保持不變。 換句話說，它總是計算出相同數量的有效數字。 例如， double的典型實現將具有約15個有效數字（轉換為Epsilon =〜1e-15）。 如果您使用的數字在10e-200范圍內，則它可以代表的最小變化約為10e-215。 如果您使用的數字在10e + 200范圍內，則它可以代表的最小變化約為1e + 185。

有意義地使用Epsilon通常需要將其縮放到您正在使用的數字的范圍，並使用它來定義一個您可能願意接受的范圍（可能由於舍入誤差），因此，如果兩個數字落在該范圍內，則您假設他們可能真的相等。 例如，在Epsilon為1e-15的情況下，您可能決定將落在彼此1e-14之內的數字視為相等（即，有效位數已舍入）。

可以表示的最小數字通常會大大小於該數字。 使用相同的典型double ，通常會在1e-308左右。 如果您使用定點數而不是浮點數，則這將等效於Epsilon。 例如，一次有很多人使用定點繪制各種圖形。 一個典型的版本是一個16位的整數，分成小數點前10位和小數點后六位。 這樣的數字可以表示從大約0到1024的數字，小數點后大約兩個（十進制）數字。 另外，您也可以將其視為帶符號的，從（大約）-512到+512，小數點后大約還有兩位數字。

在這種情況下，比例因子是固定的，因此兩個數字之間可以表示的最小差異也是固定的，即1024與下一個較大數字之間的差異與0與下一個較大數字之間的差異完全相同。

倒數

我不確定您為什么擔心計算極大或極小的倒數。 IEEE浮點使用非正規數，這意味着接近范圍極限的數字會失去精度。 基本上，數字分為指數和有效數。 指數包含數字的大小，有效數字包含有效數字。 每個都用指定的位數表示。 在通常情況下，數字是歸一化的，這意味着它們與我們大家在學校學到的科學計數法模糊地相似。 用科學計數法，您總是調整有效位數和指數，以便在小數點前精確到一位，因此（例如）140變為1.4e2，20030變為2.003e4，依此類推。

可以將其視為浮點數的“規范化”形式。 但是，假設您限制了一個2位數字的指數，因此它只能從-99到+99。 還要假設您最多可以有15個有效數字。 在這些限制范圍內，您可以產生類似0.00001002e-99的數字。 這樣一來，您可以表示小於1e-99的數字，但會損失一些精度-而不是15位數字的精度，而是使用有效數字的5位數字表示幅度，因此只剩下10位數字那真的很重要。

除了采用二進制而不是十進制之外，IEEE浮點大致以這種方式工作。 當您接近范圍的末端時，數字的精度越來越低，直到（在范圍的盡頭）僅剩一點精度。

如果您只采用一位精度的數字，並取其倒數，那么您將得到一個非常大的數字-但是由於您僅以一位精度開始，結果也只能具有一位精度。 盡管總比沒有結果要好，但仍然幾乎沒有意義。 您已經達到位數可以表示的極限。 解決該問題的唯一方法是使用更多位。

倒數（或其他計算）實際上沒有任何一點“停止變得有意義”。 這並不是一個硬道理，一個結果有意義，而另一個沒有意義。 相反，這是一個斜率，其中一個結果可能具有15個數字的精度，而另一個結果可能只有10個數字和三分之一。1“有意義”與否主要取決於您如何解釋該結果。 為了獲得有意義的結果，您需要對最終結果中的多少位數真正有意義有一個清晰的認識。