Wie Floating Point Precision berechnen . Die Genauigkeit einer Gleitkommazahl bezieht sich auf die Dichtheit der Spezifikation oder die Anzahl der signifikanten Stellen von Informationen, die durch die Anzahl gespeichert werden können. Die Genauigkeit der einzelnen Arten von Gleitkommazahl ist gleich, weil die gleiche Anzahl von Bits für die gleiche Funktion verwendet werden, unabhängig von der Größe der Anzahl . Die beiden häufigsten Sorten von Gleitkomma- Zahlen sind Singles von 32 Bits besteht und verdoppelt von 64 Bits. Things You
Rechner
brauchen anzeigen Weitere Anweisungen
32- Bit Single Floating Point
1
Beginnen Sie mit der Zahl 32 , wenn Sie der Berechnung der Präzision eines werden einfach großen Gleitkommazahl. Da eine Gleitkommazahl aus einer Kombination von 32 Einsen und Nullen besteht, gibt es genau 32 verschiedene Stücke von Informationen, die in eine Gleitkommazahl dargestellt werden kann .
2
Subtrahieren ein Bit zu berücksichtigen die positive oder negative Art der Reihe . Die 31 Bit in einem Fließkomma- Ganzzahl verwendet wird, um das Vorzeichen der Zahl , positiv oder negativ darstellen . Alle restlichen Bits werden verwendet, um den Rest der Gleitkommazahl die Informationen zu speichern.
3
Subtrahieren acht Bits aus den verbleibenden 31 Bits zur Rechenschaft für diejenigen verwendet werden, um den Exponenten der Zahl festgelegt . Diese acht Bits verwendet werden , um die Position der Gleitkommazahl der Dezimalzahl bestimmen , sind aber nicht verwendet werden, um die vorgegebene Anzahl selbst zu speichern . Unter Berücksichtigung der für die Bits , die den Exponenten und das Vorzeichen einer Gleitkommazahl darstellen , gibt es weitere 24 verwendeten Bits . Diese 24 Bits werden verwendet, um präzise numerische Informationen zu speichern , und so hat ein einzelner Gleitkommazahl 24 Bit Genauigkeit
64- Bit Floating Point Doppel
4
starten . mit der Nummer 64, das entspricht der Anzahl der Bits in einem Doppel- Gleitkommazahl.
5
Subtrahieren ein Bit zu berücksichtigen , dass die bit- positives oder negatives Vorzeichen speichert. Dies ergibt 63 verbleibenden ungenutzten Bits .
6
subtrahieren 10 Bit zur Rechenschaft für den Teil des Doppel- Fließkomma- Zahl, die verwendet werden, um die Anzahl der Exponenten Informationen speichern. Diese Berechnung ergibt 53 restlichen Bits , so eine doppelte Fließkommazahl besitzt 53 Bit Genauigkeit .