Квантование

Квантование Q реального значения V представлено взвешенной суммой битов. В контексте общего наклона и схемы кодирования смещения, значением количества фиксированной точки без знака дают

V~=S.[i=0ws1bi2i]+B,

в то время как значением количества фиксированной точки со знаком дают

V~=S.[bws12ws1+i=0ws2bi2i]+B,

где

  • bi двоичные цифры, с bi=1,0для i=0,1,...,ws1

  • Размер слова в битах дан ws с ws = 1, 2, 3,..., 128.

  • S дают F=2E, где масштабирование неограниченно, потому что двоичная точка не должна быть непрерывной со словом.

bi называются битными множителями и 2i называются весами.

Формат фиксированной точки

Форматы для 8-битных значений фиксированной точки без знака и со знаком показывают в следующем рисунке.

Обратите внимание на то, что вы не можете различить, подписываются ли эти числа или типы данных без знака просто контролем, поскольку эта информация явным образом не закодирована в слове.

Двоичное число 0011.0101 дает к тому же значению для дополнительного представления и two без знака потому что MSB = 0. Установка B = 0 и с помощью соответствующих весов, битных множителей и масштабирования, значение

V~=(F2E)Q=2E[i=0ws1bi2i]=24(0×27+0×26+1×25+1×24+0×23+1×22+0×21+1×20)=3.3125.

С другой стороны, двоичное число 1011.0101 дает к различным значениям для дополнительного представления и two без знака начиная с MSB = 1.

Установка B = 0 и с помощью соответствующих весов, битных множителей и масштабирования, значение без знака

V~=(F2E)Q=2E[i=0ws1bi2i]=24(1×27+0×26+1×25+1×24+0×23+1×22+0×21+1×20)=11.3125,

в то время как дополнительное значение two

V~=(F2E)Q=2E[bws12ws1+i=0ws2bi2i]=24(1×27+0×26+1×25+1×24+0×23+1×22+0×21+1×20)=4.6875.