定義
單精度浮點數格式是一種計算機數據格式,在計算機存儲器中占用4個位元(32 bits),利用“浮點”(浮動小數點)的方法,可以表示一個範圍很大的數值。
在IEEE 754-2008的定義中,32-bit base 2格式被正式稱為 binary32格式。這種格式在IEEE 754-1985被定義為 single,即單精度。需要注意的是,在更早的一些計算機系統中,也存在著其他4位元組的浮點數格式。
定義
第1位表示正負,中間8位表示指數,後23位儲存有效數位(有效數位是24位)。
第一位的正負號0代表正,1代表負。
中間八位共可表示2^8=256個數,指數可以是二補碼;或0到255,0到126代表-127到-1,127代表零,128-255代表1-128。
有效數位最左手邊的1並不會儲存,因為它一定存在(二進制的第一個有效數字必定是1)。換言之,有效數位是24位,實際儲存23位。
浮點數
浮點數是屬於有理數中某特定子集的數的數字表示,在計算機中用以近似表示任意某個實數。具體的說,這個實數由一個整數或定點數(即尾數)乘以某個基數(計算機中通常是2)的整數次冪得到,這種表示方法類似於基數為10的科學計數法。
浮點計算是指浮點數參與的運算,這種運算通常伴隨著因為無法精確表示而進行的近似或捨入。
一個浮點數a由兩個數m和e來表示:a = m × b^e。在任意一個這樣的系統中,我們選擇一個基數b(記數系統的基)和精度p(即使用多少位來存儲)。m(即尾數)是形如±d.ddd...ddd的p位數(每一位是一個介於0到b-1之間的整數,包括0和b-1)。如果m的第一位是非0整數,m稱作規格化的。有一些描述使用一個單獨的符號位(s 代表+或者-)來表示正負,這樣m必須是正的。e是指數。
補碼
補碼(英語: 2's complement)是一種用二進制表示有號數的方法,也是一種將數字的正負號變號的方式,常在計算機科學中使用。
一個數字的補碼就是將該數字作比特反相運算(即反碼),再將結果加1。在補碼系統中,一個負數就是用其對應正數的補碼來表示。
補碼系統的最大優點是可以在加法或減法處理中,不需因為數字的正負而使用不同的計算方式。只要一種加法電路就可以處理各種有號數加法,而且減法可以用一個數加上另一個數的補碼來表示,因此只要有加法電路及補碼電路即可完成各種有號數加法及減法,在電路設計上相當方便。
另外,補碼系統的0就只有一個表示方式,這點和反碼系統不同(在反碼系統中,0有二種表示方式),因此在判斷數字是否為0時,只要比較一次即可。
右側的表是一些8-bit補碼系統的整數。它的可表示的範圍包括-128到127,總共256(=2)個整數。