crossentropy

Потери перекрестной энтропии для задач классификации

Синтаксис

loss = перекрестная энтропия (dlY, цели)

loss = перекрестная энтропия (dlY, цели, веса)

loss = перекрестная энтропия (___, 'DataFormat', FMT)

loss = перекрестная энтропия (___, имя, значение)

Описание

Операция перекрестной энтропии вычисляет потери перекрестной энтропии между предсказаниями сети и целевыми значениями для задач классификации с одной и несколькими метками.

crossentropy функция вычисляет потери перекрестной энтропии между прогнозами и целями, представленными как dlarray данные. Используя dlarray объекты упрощают работу с высокоразмерными данными, позволяя маркировать размеры. Например, можно пометить, какие измерения соответствуют пространственным, временным, канальным и пакетным измерениям, используя 'S', 'T', 'C', и 'B' соответственно. Для неуказанных и других размеров используйте 'U' этикетка. Для dlarray функции объекта, которые работают над определенными размерами, можно указать метки размеров, отформатировав dlarray непосредственно или с помощью 'DataFormat' вариант.

Примечание

Расчет потерь перекрестной энтропии в пределах layerGraph объект или Layer для использования с trainNetwork функция, использование classificationLayer.

пример

loss = crossentropy(dlY,targets) возвращает категориальную потерю перекрестной энтропии между отформатированными dlarray объект dlY содержащие прогнозы и целевые значения targets для задач классификации с одной меткой. Продукция loss является неформатированным скаляром dlarray скаляр.

Для неформатированных входных данных используйте 'DataFormat' вариант.

loss = crossentropy(dlY,targets,weights) применяет веса к вычисленным значениям потерь. Этот синтаксис используется для взвешивания вклада классов, наблюдений, областей или отдельных элементов входных данных в вычисленные значения потерь.

loss = crossentropy(___,'DataFormat',FMT) также задает формат размера FMT когда dlY не является отформатированным dlarray.

loss = crossentropy(___,Name,Value) указывает параметры, использующие один или несколько аргументов пары имя-значение в дополнение к входным аргументам в предыдущих синтаксисах. Например, 'TargetCategories','independent' вычисляет потери перекрестной энтропии для задачи классификации с несколькими метками.

Примеры

свернуть все

Перекрестные энтропийные потери для однометочной классификации

Открыть сценарий в реальном времени

Создайте массив оценок прогнозирования для 12 наблюдений за 10 классами.

numClasses = 10;
numObservations = 12;

Y = rand(numClasses,numObservations);
dlY = dlarray(Y,'CB');
dlY = softmax(dlY);

Просмотрите размер и формат оценок прогноза.

size(dlY)

ans = 1×2

    10    12

dims(dlY)

ans = 
'CB'

Создайте массив целевых объектов, закодированных как векторы с одним горячим потоком.

labels = randi(numClasses,[1 numObservations]);
targets = onehotencode(labels,1,'ClassNames',1:numClasses);

Просмотр размера целевых объектов.

size(targets)

ans = 1×2

    10    12

Вычислите потери перекрестной энтропии между прогнозами и целями.

loss = crossentropy(dlY,targets)

loss = 
  1x1 dlarray

    2.3343

Перекрестные энтропийные потери для многометочной классификации

Открыть сценарий в реальном времени

Создайте массив оценок прогнозирования для 12 наблюдений за 10 классами.

numClasses = 10;
numObservations = 12;
Y = rand(numClasses,numObservations);
dlY = dlarray(Y,'CB');

Просмотрите размер и формат оценок прогноза.

size(dlY)

ans = 1×2

    10    12

dims(dlY)

ans = 
'CB'

Создайте случайный массив целевых объектов, закодированных как числовой массив нулей и единиц. Каждое наблюдение может иметь несколько классов.

targets = rand(numClasses,numObservations) > 0.75;
targets = single(targets);

Просмотр размера целевых объектов.

size(targets)

ans = 1×2

    10    12

Вычислите потери перекрестной энтропии между прогнозами и целями. Чтобы задать потери перекрестной энтропии для классификации с несколькими метками, установите значение 'TargetCategories' опция для 'independent'.

loss = crossentropy(dlY,targets,'TargetCategories','independent')

loss = 
  1x1 single dlarray

    9.8853

Взвешенные потери от перекрестной энтропии

Открыть сценарий в реальном времени

Создайте массив оценок прогнозирования для 12 наблюдений за 10 классами.

numClasses = 10;
numObservations = 12;

Y = rand(numClasses,numObservations);
dlY = dlarray(Y,'CB');
dlY = softmax(dlY);

Просмотрите размер и формат оценок прогноза.

size(dlY)

ans = 1×2

    10    12

dims(dlY)

ans = 
'CB'

Создайте массив целевых объектов, закодированных как векторы с одним горячим потоком.

labels = randi(numClasses,[1 numObservations]);
targets = onehotencode(labels,1,'ClassNames',1:numClasses);

Просмотр размера целевых объектов.

size(targets)

ans = 1×2

    10    12

Вычислите взвешенные потери перекрестной энтропии между прогнозами и целями с помощью весов класса вектора. Укажите формат весов 'UC' (не указан, канал) с использованием 'WeightsFormat' вариант.

weights = rand(1,numClasses);
loss = crossentropy(dlY,targets,weights,'WeightsFormat','UC')

loss = 
  1x1 dlarray

    1.1261

Входные аргументы

свернуть все

`dlY` - Прогнозы
`dlarray` | числовой массив

Прогнозы, указанные как отформатированные dlarray, неформатированный dlarrayили числовой массив. Когда dlY не является отформатированным dlarray, необходимо указать формат размера с помощью 'DataFormat' вариант.

Если dlY - числовой массив, targets должно быть dlarray.

`targets` - Метки целевой классификации
`dlarray` | числовой массив

Целевые метки классификации, указанные как форматированные или неформатированные dlarray или числовой массив.

Укажите конечные объекты как массив, содержащий одинарные закодированные метки с тем же размером и форматом, что и dlY. Например, если dlY является numObservationsоколо-numClasses массив, затем targets(n,i) = 1, если наблюдение n принадлежит классу i targets(n,i) В противном случае = 0.

Если targets является отформатированным dlarray, его формат измерения должен совпадать с форматом dlY, или то же самое, что 'DataFormat' если dlY является неформатированным

Если targets является неформатированным dlarray или числовой массив, то формат dlY или значение 'DataFormat' неявно применяется к targets.

Совет

Отформатированный dlarray объекты автоматически сортируют свои размеры. Обеспечить, чтобы размеры dlY и targets непротиворечивы, когда dlY является отформатированным dlarray, также указать targets как отформатированный dlarray.

`weights` - Веса
`dlarray` | числовой массив

Веса, указанные как dlarray или числовой массив.

Чтобы задать веса классов, укажите вектор с помощью 'C' (канал) размер с размером, соответствующим 'C' (канальный) размер dlX. Укажите 'C' (канал) размерность весов класса с помощью форматированного dlarray или с помощью 'WeightsFormat' вариант.

Чтобы задать веса наблюдения, задайте вектор с помощью 'B' (пакетное) измерение с размером, соответствующим 'B' (пакетное) измерение dlY. Укажите 'B' (пакетная) размерность весов класса с использованием форматированного dlarray или с помощью 'WeightsFormat' вариант.

Чтобы задать веса для каждого элемента ввода независимо, укажите веса как массив того же размера, что и dlY. В этом случае, если weights не является отформатированным dlarray объект, то функция использует тот же формат, что и dlY. Можно также задать формат весов с помощью 'WeightsFormat' вариант.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'TargetCategories','independent','DataFormat','CB' оценивает потери перекрестной энтропии для задач классификации с несколькими метками и определяет порядок измерения входных данных как 'CB'

`'TargetCategories'` - Тип задачи классификации
`'exclusive'` (по умолчанию) | `'independent'`

Тип задачи классификации, указанный как разделенная запятыми пара, состоящая из 'TargetCategories' и одно из следующих:

'exclusive' - Однометочная классификация. Каждое наблюдение в прогнозах dlY присваивается исключительно одной категории. Функция вычисляет потери между целевым значением для отдельной категории, указанной в targets и соответствующий прогноз в dlY, усредненное по количеству наблюдений.
'independent'- Классификация по нескольким меткам. Каждое наблюдение в прогнозах dlY может быть присвоен одной или нескольким независимым категориям. Функция вычисляет сумму потерь между каждой категорией, указанной в targets и прогнозы в dlY по этим категориям усреднено по количеству наблюдений. Потери перекрестной энтропии для этого типа задачи классификации также известны как потери двоичной перекрестной энтропии.

`'Mask'` - Маска, указывающая, какие элементы следует включить в расчет потерь
`dlarray` | логический массив | числовой массив

Маска, указывающая, какие элементы следует включить для вычисления потерь, указанная как разделенная запятыми пара, состоящая из 'Mask' и dlarray объект, логический массив или числовой массив с тем же размером, что и dlY.

Функция включает и исключает элементы входных данных для вычисления потерь, когда соответствующее значение в маске равно 1 и 0 соответственно.

Значением по умолчанию является логический массив с тем же размером, что и dlY.

Совет

Отформатированный dlarray объекты автоматически сортируют свои размеры. Обеспечить, чтобы размеры dlY и маска непротиворечивы, когда dlY является отформатированным dlarray, также укажите маску как отформатированную dlarray.

`'Reduction'` - Режим уменьшения массива значений потерь
`'sum'` (по умолчанию) | `'none'`

Режим уменьшения массива значений потерь, определяемый как разделенная запятыми пара, состоящая из 'Reduction' и одно из следующих:

'sum' - суммирование всех элементов в массиве значений потерь. В этом случае выходные данные loss является скалярным.
'none' - Не уменьшайте массив значений потерь. В этом случае выходные данные loss является неформатированным dlarray объект с тем же размером, что и dlY.

`'NormalizationFactor'` - Делитель для нормализации сниженных потерь
`'batch-size'` (по умолчанию) | `'all-elements'` | `'mask-included'` | `'none'`

Делитель для нормализации уменьшенных потерь при 'Reduction' является 'sum', указанная как пара, разделенная запятыми, состоящая из 'NormalizationFactor' и одно из следующих:

'batch-size' - Нормализовать потери путем деления на количество наблюдений в dlX.
'all-elements' - Нормализовать потери делением на количество элементов dlX.
'mask-included' - Нормализовать потери, разделив значения потерь на количество включенных элементов, указанных маской для каждого наблюдения независимо. Для использования этой опции необходимо указать маску с помощью 'Mask' вариант.
'none' - Не нормализуйте потери.

`'DataFormat'` - Порядок измерения неформатированных данных
вектор символов | строковый скаляр

Размерный порядок неформатированных входных данных, указанный как разделенная запятыми пара, состоящая из 'DataFormat' и вектор символов или строковый скаляр FMT с меткой для каждого измерения данных.

При указании формата dlarray каждый символ обеспечивает метку для каждого измерения данных и должен быть одним из следующих:

'S' - Пространственный
'C' - Канал
'B' - Партия (например, пробы и наблюдения)
'T' - Время (например, временные шаги последовательностей)
'U' - Не указано

Можно указать несколько размеров с метками 'S' или 'U'. Можно использовать метки 'C', 'B', и 'T' максимум один раз.

Необходимо указать 'DataFormat' если входные данные не являются отформатированными dlarray.

Пример: 'DataFormat','SSCB'

Типы данных: char | string

`'WeightsFormat'` - Размерный порядок весов класса
вектор символов | строковый скаляр

Порядок измерения весов класса, указанный как разделенная запятыми пара, состоящая из 'WeightsFormat' и вектор символов или строковый скаляр, который обеспечивает метку для каждого измерения весов.

'S' - Пространственный
'C' - Канал
'B' - Партия (например, пробы и наблюдения)
'T' - Время (например, временные шаги последовательностей)
'U' - Не указано

Необходимо указать 'WeightsFormat' когда weights является числовым вектором и dlX имеет два или более размеров nonsingleton.

Если weights не является вектором, или оба weights и dlY являются векторами, то значение по умолчанию 'WeightsFormat' совпадает с форматом dlY.

Пример: 'WeightsFormat','CB'

Типы данных: char | string

Выходные аргументы

свернуть все

`loss` - Потери перекрестной энтропии
`dlarray`

Потеря перекрестной энтропии, возвращенная как неформатированная dlarray. Продукция loss является неформатированным dlarray с тем же базовым типом данных, что и входные данные dlY.

Размер loss зависит от 'Reduction' вариант.

Алгоритмы

свернуть все

Потери при перекрестной энтропии

Для каждого элемента _Yj входа, crossentropy функция вычисляет соответствующие значения потерь по элементам перекрестной энтропии по формуле

$_{lossj} =_{}_{} TjlnYj +_{(} 1 − Tj)_{} ln$ (1 − Yj),

где _Tj - соответствующее целевое значение _Yj.

Чтобы уменьшить значения потерь до одного скаляра, функция затем уменьшает значения потерь по элементам до скалярных потерь с помощью формулы

$\frac{}{} \underset{}{}_{}_{}_{loss=−1N∑jmjwjlossj},$

где N - коэффициент нормализации, _mj - значение маски для элемента j, и _wj - значение веса для элемента j.

Если потери не уменьшаются, функция применяет маску и веса непосредственно к значениям потерь:

$_{lossj}^{} *_{=}_{}_{}$ mjwjlossj

В этой таблице представлены составы потерь для различных задач.

Задача	Описание	Потеря
Однометочная классификация	Потери перекрестной энтропии для взаимоисключающих классов. Это полезно, когда наблюдения должны иметь только одну метку.	$\frac{}{}_{}^{}_{}^{}_{}_{loss=−1N∑n=1N∑i=1KTnilnYni},$ где N и K - количество наблюдений и классов соответственно.
Классификация по нескольким меткам	Потери перекрестной энтропии для независимых классов. Это полезно, когда наблюдения могут иметь несколько меток.	$\frac{}{}_{}^{}_{}^{loss=−1N∑n=1N∑i=1K} (_{} Tnilog_{(} Yni) +_{(1} - Tni)_{} log ($ 1 − Yni)), где N и K - количество наблюдений и классов соответственно.
Однометочная классификация с взвешенными классами	Потери перекрестной энтропии с весами класса. Это полезно для наборов данных с несбалансированными классами.	$\frac{}{}_{}^{}_{}^{}_{}_{}_{loss=−1N∑n=1N∑i=1KwiTnilnYni},$ где N и K - количество наблюдений и классов соответственно, а _wi - вес для класса i.
Классификация последовательности к последовательности	Потери перекрестной энтропии с маскированными шагами времени. Это полезно для игнорирования значений потерь, соответствующих дополненным данным.	$\frac{}{}_{}^{}_{}^{}_{}_{}^{}_{}_{loss=−1N∑n=1N∑t=1Smnt∑i=1KTntilnYnti},$ где N, S и K - количество наблюдений, временных шагов и классов, _mnt обозначает значение маски для временного шага t наблюдения n.

Расширенные возможности

Массивы графических процессоров
Ускорьте выполнение кода с помощью графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Примечания и ограничения по использованию:

Если хотя бы один из следующих входных аргументов является gpuArray или dlarray с базовыми данными типа gpuArray, эта функция выполняется на GPU:
- dlY
- targets
- weights
- 'Mask'

Дополнительные сведения см. в разделе Запуск функций MATLAB на графическом процессоре (панель инструментов параллельных вычислений).

См. также

Темы

Представлен в R2019b

Документация

crossentropy

Синтаксис

Описание

Примеры

Перекрестные энтропийные потери для однометочной классификации

Перекрестные энтропийные потери для многометочной классификации

Взвешенные потери от перекрестной энтропии

Входные аргументы

`dlY` - Прогнозы
`dlarray` | числовой массив

`targets` - Метки целевой классификации
`dlarray` | числовой массив

`weights` - Веса
`dlarray` | числовой массив

Аргументы пары «имя-значение»

`'TargetCategories'` - Тип задачи классификации
`'exclusive'` (по умолчанию) | `'independent'`

`'Mask'` - Маска, указывающая, какие элементы следует включить в расчет потерь
`dlarray` | логический массив | числовой массив

`'Reduction'` - Режим уменьшения массива значений потерь
`'sum'` (по умолчанию) | `'none'`

`'NormalizationFactor'` - Делитель для нормализации сниженных потерь
`'batch-size'` (по умолчанию) | `'all-elements'` | `'mask-included'` | `'none'`

`'DataFormat'` - Порядок измерения неформатированных данных
вектор символов | строковый скаляр

`'WeightsFormat'` - Размерный порядок весов класса
вектор символов | строковый скаляр

Выходные аргументы

`loss` - Потери перекрестной энтропии
`dlarray`

Алгоритмы

Потери при перекрестной энтропии

Расширенные возможности

Массивы графических процессоров
Ускорьте выполнение кода с помощью графического процессора (GPU) с помощью Parallel Computing Toolbox™.

См. также

Темы

Документация по инструментам для глубокого обучения

Поддержка

Документация

crossentropy

Синтаксис

Описание

Примеры

Перекрестные энтропийные потери для однометочной классификации

Перекрестные энтропийные потери для многометочной классификации

Взвешенные потери от перекрестной энтропии

Входные аргументы

dlY - Прогнозы dlarray | числовой массив

targets - Метки целевой классификации dlarray | числовой массив

weights - Веса dlarray | числовой массив

Аргументы пары «имя-значение»

'TargetCategories' - Тип задачи классификации 'exclusive' (по умолчанию) | 'independent'

'Mask' - Маска, указывающая, какие элементы следует включить в расчет потерь dlarray | логический массив | числовой массив

'Reduction' - Режим уменьшения массива значений потерь 'sum' (по умолчанию) | 'none'

'NormalizationFactor' - Делитель для нормализации сниженных потерь 'batch-size' (по умолчанию) | 'all-elements' | 'mask-included' | 'none'

'DataFormat' - Порядок измерения неформатированных данных вектор символов | строковый скаляр

'WeightsFormat' - Размерный порядок весов класса вектор символов | строковый скаляр

Выходные аргументы

loss - Потери перекрестной энтропии dlarray

Алгоритмы

Потери при перекрестной энтропии

Расширенные возможности

Массивы графических процессоров Ускорьте выполнение кода с помощью графического процессора (GPU) с помощью Parallel Computing Toolbox™.

См. также

Темы

Документация по инструментам для глубокого обучения

Поддержка

`dlY` - Прогнозы
`dlarray` | числовой массив

`targets` - Метки целевой классификации
`dlarray` | числовой массив

`weights` - Веса
`dlarray` | числовой массив

`'TargetCategories'` - Тип задачи классификации
`'exclusive'` (по умолчанию) | `'independent'`

`'Mask'` - Маска, указывающая, какие элементы следует включить в расчет потерь
`dlarray` | логический массив | числовой массив

`'Reduction'` - Режим уменьшения массива значений потерь
`'sum'` (по умолчанию) | `'none'`

`'NormalizationFactor'` - Делитель для нормализации сниженных потерь
`'batch-size'` (по умолчанию) | `'all-elements'` | `'mask-included'` | `'none'`

`'DataFormat'` - Порядок измерения неформатированных данных
вектор символов | строковый скаляр

`'WeightsFormat'` - Размерный порядок весов класса
вектор символов | строковый скаляр

`loss` - Потери перекрестной энтропии
`dlarray`

Массивы графических процессоров
Ускорьте выполнение кода с помощью графического процессора (GPU) с помощью Parallel Computing Toolbox™.