主題
Search

浮點數


浮點數是在浮點格式中可表示的有限或無限的數,即不是 NaN浮點表示

IEEE 754-2008 標準中,所有浮點數(包括零和無窮大)都是有符號的。

IEEE 754-2008 允許五種“基本格式”用於浮點數,包括三種二進位制格式(32 位、64 位和 128 位)和兩種十進位制格式(64 位和 128 位);它還指定了幾種“推薦格式”,用於擴充套件這些基本格式以實現更高的精度。所有基本數值格式的特徵在於指定一個基數 b in {2,10},一個精度 p(即尾數中的位數),以及一個指數範圍 emin,emin+1,...,emax,該範圍由給定格式的精度決定。一般來說,非零浮點數的形式為

 (-1)^s×b^e×m,

其中 s in {0,1} 表示數字的符號emin<=e<=emax 是其指數,0<=m<=b 是其尾數。請注意,(1)中的描述框架使得尾數 m 以科學計數法形式檢視(小數點或基點緊跟在第一位數字之後),儘管(1)可以重新表示以將 m 視為整數(由此,m 和指數 e 在(1)中都將相應地更改格式)。

32 位二進位制64 位二進位制128 位二進位制64 位十進位制128 位十進位制
p 的位數24531131634
emax+127+1023+16383+384+6144

上表總結了五種基本數字格式的特徵。請注意,根據定義,emin=1-emax

32 位二進位制64 位二進位制128 位二進位制64 位十進位制128 位十進位制
p 的位數>=32>=64>=128>=22>=40
emax>=1023>=16383>=65535>=6144>=24576

如前所述,IEEE 754 還提供了一個推薦格式框架,透過該框架可以擴充套件五種基本格式。上表總結了這些擴充套件格式浮點數的引數特徵。請注意,所有這些格式(基本格式和推薦格式)都允許 +infty-infty-0,以及兩個 NaN。

在文獻中,規格化浮點數和次規格化浮點數之間存在區別。 特別是,最小的正規格化浮點數是 b^(emin),最大的是 b^(emax)×(b-b^(1-p));另一方面,量級小於 b^(emin) 的非零浮點數可能存在,稱為次規格化數。次規格化數的特徵在於它們始終少於 p 個有效數字;此外,每個有限浮點數都是最小次規格化量級的整數倍

 b^(emin)×b^(1-p)

(IEEE 計算機協會 2008)。


另請參閱

算術, 偏置指數, 浮點代數, 浮點運算, 浮點指數, 規格化浮點數, 浮點首選指數, 浮點量子, 浮點表示, IEEE 754-2008, 區間算術, NaN, 安靜 NaN, 訊號 NaN, 尾數, 次規格化數

此條目由 Christopher Stover 貢獻

使用 探索

參考文獻

Goldberg, D. "每個計算機科學家都應該瞭解的浮點運算。" ACM Comput. Surv. 23, 5-48, 1991 年 3 月。 http://docs.sun.com/source/806-3568/ncg_goldberg.htmlHauser, J. R. "數值程式中浮點異常的處理。" ACM Trans. Program. Lang. Sys. 18, 139-174, 1996。 http://www.jhauser.us/publications/HandlingFloatingPointExceptions.htmlIEEE 計算機協會。“浮點運算 IEEE 標準:IEEE Std 754-2008(IEEE Std 754-1985 修訂版)。” 2008。 http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=4610935Severance, C. (Ed.). "IEEE 754:William Kahan 訪談。" Computer, 114-115, 1998 年 3 月。Stevenson, D. "二進位制浮點運算的擬議標準:IEEE Task P754 的 8.0 草案。" IEEE Comput. 14, 51-62, 1981。

請引用為

Stover, Christopher. "浮點數。" 來自 Web 資源,由 Eric W. Weisstein 建立。 https://mathworld.tw/Floating-PointNumber.html

主題分類