Рекомендации по арифметике и масштабированию

Арифметические операции и масштабирование с фиксированной точкой

Следующие разделы описывают взаимосвязь между арифметическими операциями и масштабированием с фиксированной точкой и предлагают некоторые основные рекомендации, которые могут быть подходящими для конструкции с фиксированной точкой. Для каждой арифметической операции,

Используется общая схема кодирования [наклон смещения], описанная в разделе Масштабирование.
Масштабирование результата выбирается автоматически на основе масштабирования двух входных данных. Другими словами, масштабирование наследуется.
Варианты масштабирования основаны на
- Минимизация количества арифметических операций результата
- Максимизация точности результата
Кроме того, масштабирование только в двоичной точке представлено как частный случай общей схемы кодирования.

Во встроенных системах масштабирование переменных на аппаратном интерфейсе (АЦП или ЦАП) является фиксированным. Однако для большинства других переменных масштабирование - это то, что вы можете выбрать, чтобы дать наилучший дизайн. При масштабировании переменных с фиксированной точкой важно помнить, что

Выбор масштабирования зависит от конкретной моделируемой конструкции.
Нет лучшего подхода к масштабированию. Все варианты имеют связанные с этим преимущества и недостатки. Цель этого раздела - раскрыть вам эти преимущества и недостатки.

Дополнение

Рассмотрим добавление двух реальных ценностей:

$_{Va} =_{} {Vb}_{} +$ Vc.

Эти значения представлены общей схемой кодирования [наклон смещения], описанной в разделе Масштабирование:

$_{Vi} =_{}^{_{}}_{} {Fi2EiQi}_{} +$ Bi.

В системе с фиксированной точкой добавление значений приводит к нахождению переменной _Qa:

$_{Qa} \frac{=_{}}{_{}}^{_{} {FbFa2Eb}_{}} -_{} \frac{_{}}{{EaQb}_{}} +^{_{}_{}}_{} FcFa2Ec \frac{_{-}_{} {EaQc}_{}}{+_{}}^{Bb_{+}}$ Bc − BaFa2 − Ea.

Эта формула показывает

В общем случае _Qa не вычисляется посредством простого добавления _Qb и _Qc.
В общем, существует два умножения константы и переменной, два сложения и некоторое дополнительное битовое смещение.

Унаследованное масштабирование для скорости

В процессе нахождения масштабирования суммы одной из разумных целей является упрощение вычислений. Упрощение вычислений должно уменьшить количество операций, увеличив тем самым скорость выполнения. Минимизировать количество арифметических операций можно с помощью следующих вариантов:

Установить _Ba = _Bb + _Bc. Это исключает одно добавление.
Установите _Fa = _Fb или _Fa = _Fc. Любой из вариантов исключает одно из двух переменных умножений на константу.

Результирующая формула

$_{Qa} =^{_{} {2Eb}_{}} -_{} \frac{_{}}{{EaQb}_{}} +^{_{}_{}}_{}$ FcFa2Ec − EaQc

или

$_{Qa} \frac{=_{}}{_{}}^{_{} {FbFa2Eb}_{}} -_{}^{_{EaQb} +_{}}_{} 2Ec$ − EaQc.

Эти уравнения представляются эквивалентными. Однако выбор округления и точности может сделать один выбор особенным по сравнению с другим. Для дальнейшего упрощения можно выбрать _Ea = _Ec или _Ea = _Eb. Это устранит некоторое смещение битов.

Унаследованное масштабирование для максимальной точности

В процессе нахождения масштабирования суммы одной разумной целью является максимальная точность. Масштабирование с максимальной точностью можно определить, если диапазон переменной известен. Команда Максимизировать точность (Maximize Precision) показывает, что диапазон операций с фиксированной точкой можно определить из значений max (_Va) и min ₍Va). Для суммирования можно определить диапазон от

$\begin{array}{l} минута {\overset{}{}}_{} {\overset{}{(V˜a) =min}}_{} {\overset{}{}}_{(V˜b) +min} \\ (V˜c) {\overset{}{,}}_{} макс. {\overset{}{}}_{} (V˜a) =max {\overset{}{}}_{} \end{array}$ (V˜b) +max (V˜c).

Теперь можно получить откос с максимальной точностью:

$\begin{matrix} _{}^{_{Fa2Ea}} \frac{= {\max^{}}_{(} V˜a) - {\overset{}{}}_{} min}{^{(_{}} V˜a)} \\ \frac{_{}^{{2wsa}_{}} -^{1_{=}}_{Fa2Eb}^{(_{}}^{2wsb_{-}} 1)}{^{+_{}}} \end{matrix}$ Fc2Ec (2wsc − 1) 2wsa − 1.

В большинстве случаев размеры входного и выходного слов намного больше единицы, и наклон становится

$_{}^{_{}}_{}^{_{}_{}_{}}_{}^{_{}_{}_{Fa2Ea≈Fb2Eb+wsb−wsa+Fc2Ec+wsc−wsa}},$

который зависит только от размера входных и выходных слов. Соответствующее смещение

$_{Ba} = {\overset{}{мин}}_{(} {V˜a}_{)}^{-_{}}_{} Fa2Eamin$ (Qa).

Значение смещения зависит от того, являются ли входы и выходы подписанными или неподписанными числами.

Если все входы и выходы не подписаны, то минимальные значения для этих переменных равны нулю, и смещение уменьшается до особенно простой формы:

$_{Ba} =_{} {Bb}_{} +$ Bc.

Если входы и выход все подписаны, то смещение становится

$\begin{array}{l} _{}_{}_{}_{}^{_{Ba≈Bb+Bc+Fb2Eb}} (−^{_{} 2wsb} −^{1_{} +}_{2wsb}^{-_{}} 1)^{+_{}} {Fc2Ec}^{(_{-}} \\ {2wsc}_{} -_{1} +_{} \end{array}$ 2wsc − 1), Ba≈Bb+Bc.

Масштабирование только двоичных точек

Для масштабирования только в двоичной точке поиск _Qa приводит к следующему простому выражению:

$_{Qa} =^{_{} {2Eb}_{}} -_{}^{_{EaQb} +_{}}_{} 2Ec$ − EaQc.

Этот выбор масштабирования приводит только к одному сложению и некоторым сдвигам битов. Исключение каких-либо умножений является большим преимуществом масштабирования только в двоичной точке.

Примечание

Вычитание значений дает результаты, аналогичные результатам, полученным при добавлении значений.

Накопление

Накопление значений тесно связано с добавлением:

$_{}_{}_{Va_new=Va_old+Vb} .$

Поиск _{Qa_new} включает в себя одно умножение константы и переменной, два сложения и некоторое битовое смещение:

$_{}_{} \frac{_{}}{_{}}^{_{}_{}}_{} \frac{_{}}{_{}}^{_{Qa_new=Qa_old+FbFa2Eb−EaQb+BbFa2−Ea}} .$

Важным отличием для реализации с фиксированной точкой является то, что масштабирование выходного сигнала идентично масштабированию первого входного сигнала.

Масштабирование только двоичных точек

Для масштабирования только в двоичной точке поиск _{Qa_new} приводит к следующему простому выражению:

$_{}_{}^{_{}_{}}_{Qa_new=Qa_old+2Eb−EaQb} .$

Эта опция масштабирования включает только одно сложение и некоторое смещение битов.

Примечание

Отрицательное накопление значений дает результаты, аналогичные результатам, полученным при накоплении значений.

Умножение

Рассмотрим умножение двух реальных значений:

$_{Va} =_{}_{}$ VbVc.

Эти значения представлены общей схемой кодирования [наклон смещения], описанной в разделе Масштабирование:

$_{Vi} =_{}^{_{}}_{} {Fi2EiQi}_{} +$ Bi.

В системе с фиксированной точкой умножение значений приводит к нахождению переменной _Qa:

$\begin{matrix} _{Qa} \frac{=_{}_{}}{_{}}^{_{} {FbFcFa2Eb}_{} +_{}} {Ec}_{} -_{} \frac{_{}_{}}{{EaQbQc}_{}} +^{_{}_{}}_{} \\ \frac{_{FbBcFa2Eb}_{-}}{_{}}^{_{EaQb} +_{}}_{} \frac{_{}_{} {FcBbFa2Ec}_{}}{-_{}}^{_{EaQc}} \end{matrix}$ + BbBc − BaFa2 − Ea.

Эта формула показывает

В общем случае _Qa не вычисляется посредством простого умножения _Qb и _Qc.
В общем, существует одно умножение константы и двух переменных, два умножения константы и переменной, три сложения и некоторое дополнительное битовое смещение.

Унаследованное масштабирование для скорости

Количество арифметических операций можно уменьшить с помощью следующих вариантов:

Установить _Ba = _BbBc. Это исключает одну операцию сложения.
Установка _Fa = _FbFc. Это упрощает тройное умножение - безусловно, самая трудная часть уравнения для реализации.
Установите _Ea = _Eb + _Ec. Это устраняет некоторое смещение битов.

Результирующая формула

$_{Qa} =_{}_{} \frac{{QbQc}_{}}{+_{}}^{_{}} {BcFc2}_{} - \frac{_{}}{_{}} {EcQb}^{+_{}}_{}$ BbFb2 − EbQc.

Унаследованное масштабирование для максимальной точности

Масштабирование с максимальной точностью можно определить, если диапазон переменной известен. Команда Максимизировать точность (Maximize Precision) показывает, что можно определить диапазон операций с фиксированной точкой из

$\max {\overset{}{(}}_{} V˜a$ )

$мин {\overset{}{(}}_{} V˜a$ ).

Для умножения можно определить диапазон от

$\begin{matrix} \min {\overset{}{(}}_{} V˜a) =_{\min} (_{VLL},_{} VLH,_{} VHL \\ , {\overset{)}{VHH}}_{,} \max (_{V˜a})_{=}_{\max} (_{VLL}, \end{matrix}$ VLH, VHL, VHH),

где

$\begin{array}{l} _{VLL} = {\min^{}}_{(} V˜b) {\overset{}{}}_{⋅min} ( \\ _{V˜c}), {\overset{}{VLH}}_{=} \min ({\overset{}{}}_{V˜b}) \\ _{} \cdotmax ({\overset{)}{V˜c}}_{,} VHL = {\overset{}{}}_{} max \\ (_{} V˜b) {\overset{\cdotmin}{}}_{} (V˜c), {\overset{}{}}_{} VHH \end{array}$ = max (V˜b) ⋅max (V˜c).

Масштабирование только двоичных точек

Для масштабирования только в двоичной точке поиск _Qa приводит к следующему простому выражению:

$_{Qa} =^{_{} {2Eb}_{} +_{}} {Ec}_{} -_{}$ EaQbQc.

Выгода

Рассмотрим умножение константы и переменной

$_{Va} = K_{}$ Vb,

где K - константа, называемая коэффициентом усиления. Поскольку _Va является результатом умножения константы и переменной, то нахождение _Qa является упрощенной версией общей формулы умножения с фиксированной точкой:

$_{Qa} = \frac{(_{}^{_{}}}{_{}^{_{}}} KFb2EbFa2Ea)_{} Qb \frac{+_{} (_{}}{{KBb}_{} −^{_{}}}$ BaFa2Ea).

Обратите внимание, что термины в скобках можно вычислить в автономном режиме. Поэтому существует только одно умножение константы и переменной и одно сложение.

Чтобы реализовать вышеприведенное уравнение без изменения его на более сложный вид, константы должны быть закодированы с использованием формата только двоичной точки. Для каждой из этих констант диапазон является тривиальным случаем только одного значения. Несмотря на тривиальный диапазон, двоичные точечные формулы для максимальной точности по-прежнему действительны. Представления с максимальной точностью являются наиболее полезными вариантами, если нет необходимости избегать каких-либо сдвигов. Кодирование констант:

$\begin{array}{l} (\frac{_{}^{_{}}}{_{}^{_{KFb2EbFa2Ea}}}) =^{_{}}_{} \\ \frac{2EXQX_{(}_{KBb}}{_{-}^{_{}}}^{_{BaFa2Ea}})_{} \end{array}$ = 2EYQY

в результате получается формула

$_{Qa} =^{_{}}_{}_{} {2EXQXQB}^{_{+}}_{}$ 2EYQY.

Унаследованное масштабирование для скорости

Количество арифметических операций можно уменьшить с помощью следующих вариантов:

Установить _Ba = _KBb. Это исключает один постоянный член.
Установите _Fa = _KFb и _Ea = _Eb. Это устанавливает другой постоянный член к единице.
Результирующая формула просто
$_{Qa} =_{}$ Qb.

Если количество битов отличается, то единственной возможной операцией является обработка потенциальных переполнений или выполнение расширения знака.

Унаследованное масштабирование для максимальной точности

Масштабирование для максимальной точности не обязательно должно отличаться от масштабирования для скорости, если выходной сигнал не имеет меньше битов, чем входной сигнал. Если это так, то насыщения следует избегать, деля наклон на 2 для каждого потерянного бита. Это предотвращает насыщение, но вызывает округление.

Подразделение

Разделение значений - это операция, которую следует избегать во встроенных системах с фиксированной точкой, но она может происходить местами. Поэтому рассмотрим разделение двух реальных ценностей:

$_{Va} =_{}_{}$ Vb/Vc.

Эти значения представлены общей схемой кодирования [наклон смещения], описанной в разделе Масштабирование:

$_{Vi} =_{}^{_{}}_{} {Fi2EiQi}_{} +$ Bi.

В системе с фиксированной точкой разделение значений приводит к нахождению переменной _Qa:

$_{Qa} \frac{=_{}^{_{}}_{} {Fb2EbQb}_{}}{+_{}_{}^{_{}_{}} {BbFcFa2Ec}_{} +_{}_{} {EaQc}^{_{+}}} \frac{_{}}{_{}}^{{BcFa2Ea}_{}} -$ BaFa2 − Ea.

Эта формула показывает

В общем случае _Qa не вычисляется посредством простого деления _Qb на _Qc.
В общем, существует два умножения константы и переменной, два сложения, одно деление переменной на переменную, одно деление константы на переменную и некоторое дополнительное битовое смещение.

Унаследованное масштабирование для скорости

Количество арифметических операций можно уменьшить с помощью следующих вариантов:

Установить _Ba = 0. Это исключает одну операцию сложения.
Если _Bc = 0, то задайте дробный уклон _Fa = _Fb/Fc. Это исключает одно постоянное умножение на переменную.

Результирующая формула

$_{Qa} \frac{=_{}}{_{}}^{_{} {QbQc2Eb}_{} -_{}} Ec \frac{-_{} {Ea}_{} +}{_{(}}^{_{} Bb/Fb)_{}}$ Qc2 − Ec − Ea.

Если _Bc ≠ 0, то не может быть дана четкая рекомендация.

Унаследованное масштабирование для максимальной точности

$\max {\overset{}{(}}_{} V˜a$ )

$мин {\overset{}{(}}_{} V˜a$ ).

Для деления можно определить диапазон от

$\begin{matrix} \min {\overset{}{(}}_{} V˜a) =_{\min} (_{VLL},_{} VLH,_{} VHL \\ , {\overset{)}{VHH}}_{,} \max (_{V˜a})_{=}_{\max} (_{VLL}, \end{matrix}$ VLH, VHL, VHH),

где для ненулевых знаменателей

$\begin{array}{l} _{} VLL=min {\overset{}{}}_{} (V˜b) / {\overset{}{минута}}_{} \\ _{(V˜c),} {\overset{VLH=min}{}}_{} (V˜b) {\overset{}{/}}_{} макс. \\ _{} (V˜c), {\overset{}{}}_{} VHL=max {\overset{(V˜b)}{}}_{} / \\ _{минута} (V˜c) {\overset{}{,}}_{} VHH=max {\overset{}{}}_{} (V˜b) \end{array}$ / макс. (V˜c).

Масштабирование только двоичных точек

Для масштабирования только в двоичной точке поиск _Qa приводит к следующему простому выражению:

$_{Qa} \frac{=_{}}{_{}}^{_{} {QbQc2Eb}_{} -_{}} Ec$ − Ea.

Примечание

Для последних двух формул, включающих _Qa, возможно деление на ноль и деление на ноль. В этих случаях аппаратные средства обеспечивают определенное поведение по умолчанию, но необходимо убедиться, что эти ответы по умолчанию дают значимые результаты для встроенной системы.

Резюме

Из предыдущего анализа переменных с фиксированной точкой, масштабированных в рамках общей схемы кодирования [Slope Bias], можно сделать вывод

Кроме того, вычитание, умножение и деление могут быть очень вовлечены, если для смещений и откосов не будут сделаны определенные варианты.
Бинарное масштабирование гарантирует более простую математику, но обычно жертвует некоторой точностью.

Обратите внимание, что в предыдущих формулах не показано следующее:

Константы и переменные представлены конечным числом битов.
Переменные либо подписаны, либо не подписаны.
Схемы округления и обработки переполнения. Эти решения необходимо принять до достижения фактической реализации с фиксированной точкой.

См. также

Вычисление

Документация