Квантование Q действительного значения V представлено взвешенной суммой битов. В контексте общей схемы кодирования наклона и смещения значение неназначенной величины фиксированной точки задается посредством
∑i=0ws−1bi2i]+B,
в то время как значение подписанного количества с фиксированной точкой задается
−bws−12ws−1+∑i=0ws−2bi2i]+B,
где
- двоичные цифры, с 1,0, ws − 1
Размер слова в битах задается ws, с ws = 1, 2, 3,..., 128.
S задается 2E, где масштабирование не ограничено, потому что двоичная точка не должна быть смежной со словом.
называются битовыми умножителями, а - весовыми коэффициентами.
Форматы для 8-битных подписанных и неподписанных фиксированных значений показаны на следующем рисунке.

Обратите внимание, что невозможно определить, являются ли эти номера подписанными или неподписанными типами данных только путем проверки, поскольку эта информация явно не закодирована в слове.
Двоичное число 0011.0101 вырабатывает одно и то же значение для представления без знака и двух дополнений, поскольку MSB = 0. Установка B = 0 и используя соответствующие веса, битовые множители и масштабирование, значение равно
+ 1 × 22 + 0 × 21 + 1 × 20) = 3,3125.
И наоборот, двоичное число 1011.0101 дает различные значения для представления без знака и двух дополнений, поскольку MSB = 1.
Установка B = 0 и используя соответствующие веса, битовые множители и масштабирование, неподписанное значение равно
1 × 22 + 0 × 21 + 1 × 20) = 11,3125,
в то время как значение дополнения для двух
+ 1 × 22 + 0 × 21 + 1 × 20) = − 4,6875.