float与double的范围和精度

1. 范围

float和double的范围是由指数的位数来决定的。（因为表示的时候都是1.x * 2^Y的形式，所以忽略了1.x的效果，直接取指数表示浮点数的范围）

float的指数位有8位，而double的指数位有11位，分布如下：

float：

1bit（符号位）8bits（指数位）23bits（尾数位）

double：

1bit（符号位）11bits（指数位）52bits（尾数位）

于是，float的指数范围为-127~+128，而double的指数范围为-1023~+1024，并且指数位是按补码的形式来划分的。

其中负指数决定了浮点数所能表达的绝对值最小的非零数；而正指数决定了浮点数所能表达的绝对值最大的数，也即决定了浮点数的取值范围。

float的范围为-2^128 ~ +2^128，也即-3.40E+38 ~ +3.40E+38；double的范围为-2^1024 ~ +2^1024，也即-1.79E+308 ~ +1.79E+308。

2. 精度

float和double的精度是由尾数的位数来决定的（精度，也就是那个程序中的EPSINON，是由尾数来决定的）。浮点数在内存中是按科学计数法来存储的，其整数部分始终是一个隐含着的“1”，由于它是不变的，故不能对精度造成影响。

float：2^23 = 8388608，一共七位，这意味着最多能有7位有效数字，但绝对能保证的为6位，也即float的精度为6~7位有效数字；

double：2^52 = 4503599627370496，一共16位，同理，double的精度为15~16位。

所以，我们可以知道浮点数跟“0”比较大小的时候，EPSINON的由来了。

补充：软件开发 , C语言 ,