predict

Предскажите ответы с помощью обученной глубокой нейронной сети

Описание

Можно сделать предсказания с помощью обученной нейронной сети для глубокого обучения или на центральном процессоре или на графическом процессоре. Используя графический процессор требует Parallel Computing Toolbox™ и поддерживаемого устройства графического процессора. Для получения информации о поддерживаемых устройствах смотрите Поддержку графического процессора Релизом (Parallel Computing Toolbox). Задайте требования к аппаратным средствам с помощью ExecutionEnvironment аргумент пары "имя-значение".

YPred = predict(net,imds) предсказывает ответы для данных изображения в imds использование обученного SeriesNetwork или DAGNetwork объект net. Для dlnetwork введите, смотрите predict.

YPred = predict(net,ds) предсказывает ответы для данных в datastore ds.

YPred = predict(net,tbl) предсказывает ответы для данных в таблице tbl.

пример

YPred = predict(net,X) предсказывает ответы для изображения или данных о функции в числовом массиве X.

YPred = predict(net,X1,...,XN) предсказывает ответы для данных в числовых массивах X1, …, XN для mutli-входной сети net. Вход Xi соответствует сетевому входу net.InputNames(i).

[YPred1,...,YPredM] = predict(___) предсказывает ответы для M выходные параметры мультивыходной сети, использующей любой из предыдущих синтаксисов. Выход YPredj соответствует сетевому выходу net.OutputNames(j). Чтобы возвратить категориальные выходные параметры для классификации выходные слои, установите 'ReturnCategorical' опция к true.

пример

YPred = predict(net,sequences) предсказывает ответы для последовательности или данных временных рядов в sequences с помощью обученной текущей сети (например, LSTM или сеть ГРУ) net.

пример

___ = predict(___,Name,Value) предсказывает ответы с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение".

Совет

При создании предсказаний с последовательностями различных длин мини-пакетный размер может повлиять на объем дополнения добавленного к входным данным, которые могут привести к различным ожидаемым значениям. Попытайтесь использовать различные значения, чтобы видеть, который работает лучше всего с вашей сетью. Чтобы задать мини-пакетный размер и дополнительные опции, используйте 'MiniBatchSize' и 'SequenceLength' опции, соответственно.

Примеры

свернуть все

Загрузите выборочные данные.

[XTrain,YTrain] = digitTrain4DArrayData;

digitTrain4DArrayData загружает набор обучающих данных цифры как 4-D данные массива. XTrain 28 28 1 5 000 массивов, где 28 высота, и 28 ширина изображений. 1 количество каналов, и 5000 количество синтетических изображений рукописных цифр. YTrain категориальный вектор, содержащий метки для каждого наблюдения.

Создайте архитектуру сверточной нейронной сети.

layers = [ ...
    imageInputLayer([28 28 1])
    convolution2dLayer(5,20)
    reluLayer
    maxPooling2dLayer(2,'Stride',2)
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer];

Установите опции на настройки по умолчанию для стохастического градиентного спуска с импульсом.

options = trainingOptions('sgdm');

Обучите сеть.

rng('default')
net = trainNetwork(XTrain,YTrain,layers,options);
Training on single CPU.
Initializing input data normalization.
|========================================================================================|
|  Epoch  |  Iteration  |  Time Elapsed  |  Mini-batch  |  Mini-batch  |  Base Learning  |
|         |             |   (hh:mm:ss)   |   Accuracy   |     Loss     |      Rate       |
|========================================================================================|
|       1 |           1 |       00:00:00 |       10.16% |       2.3195 |          0.0100 |
|       2 |          50 |       00:00:02 |       50.78% |       1.7102 |          0.0100 |
|       3 |         100 |       00:00:03 |       63.28% |       1.1632 |          0.0100 |
|       4 |         150 |       00:00:05 |       60.16% |       1.0859 |          0.0100 |
|       6 |         200 |       00:00:06 |       68.75% |       0.8996 |          0.0100 |
|       7 |         250 |       00:00:08 |       76.56% |       0.7919 |          0.0100 |
|       8 |         300 |       00:00:09 |       73.44% |       0.8411 |          0.0100 |
|       9 |         350 |       00:00:11 |       81.25% |       0.5514 |          0.0100 |
|      11 |         400 |       00:00:12 |       90.62% |       0.4744 |          0.0100 |
|      12 |         450 |       00:00:14 |       92.19% |       0.3614 |          0.0100 |
|      13 |         500 |       00:00:15 |       94.53% |       0.3159 |          0.0100 |
|      15 |         550 |       00:00:17 |       96.09% |       0.2543 |          0.0100 |
|      16 |         600 |       00:00:19 |       92.19% |       0.2765 |          0.0100 |
|      17 |         650 |       00:00:20 |       95.31% |       0.2461 |          0.0100 |
|      18 |         700 |       00:00:22 |       99.22% |       0.1418 |          0.0100 |
|      20 |         750 |       00:00:23 |       98.44% |       0.1000 |          0.0100 |
|      21 |         800 |       00:00:25 |       98.44% |       0.1448 |          0.0100 |
|      22 |         850 |       00:00:26 |       98.44% |       0.0989 |          0.0100 |
|      24 |         900 |       00:00:28 |       96.88% |       0.1316 |          0.0100 |
|      25 |         950 |       00:00:30 |      100.00% |       0.0859 |          0.0100 |
|      26 |        1000 |       00:00:32 |      100.00% |       0.0701 |          0.0100 |
|      27 |        1050 |       00:00:34 |      100.00% |       0.0759 |          0.0100 |
|      29 |        1100 |       00:00:36 |       99.22% |       0.0663 |          0.0100 |
|      30 |        1150 |       00:00:37 |       98.44% |       0.0775 |          0.0100 |
|      30 |        1170 |       00:00:38 |       99.22% |       0.0732 |          0.0100 |
|========================================================================================|
Training finished: Max epochs completed.

Запустите обучивший сеть на наборе тестов и предскажите баллы.

[XTest,YTest] = digitTest4DArrayData;
YPred = predict(net,XTest);

predict, по умолчанию, использует CUDA®, включенный графический процессор с, вычисляют возможность 3.0, когда доступно. Можно также принять решение запустить predict на центральном процессоре с помощью 'ExecutionEnvironment','cpu' аргумент пары "имя-значение".

Отобразите первые 10 изображений в тестовых данных и сравните с предсказаниями от predict.

YTest(1:10,:)
ans = 10x1 categorical
     0 
     0 
     0 
     0 
     0 
     0 
     0 
     0 
     0 
     0 

YPred(1:10,:)
ans = 10x10 single matrix

    0.9978    0.0001    0.0008    0.0002    0.0003    0.0000    0.0004    0.0000    0.0002    0.0003
    0.8883    0.0000    0.0472    0.0001    0.0000    0.0002    0.0029    0.0001    0.0014    0.0599
    0.9998    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0001
    0.9814    0.0000    0.0000    0.0000    0.0000    0.0000    0.0046    0.0000    0.0011    0.0129
    0.9748    0.0000    0.0132    0.0003    0.0000    0.0000    0.0002    0.0004    0.0112    0.0001
    0.9872    0.0000    0.0001    0.0000    0.0000    0.0000    0.0007    0.0000    0.0072    0.0047
    0.9981    0.0000    0.0000    0.0000    0.0000    0.0000    0.0018    0.0000    0.0000    0.0000
    1.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000
    0.9270    0.0000    0.0046    0.0000    0.0006    0.0009    0.0001    0.0000    0.0018    0.0650
    0.9328    0.0000    0.0139    0.0012    0.0001    0.0001    0.0378    0.0000    0.0110    0.0031

YTest содержит цифры, соответствующие изображениям в XTest. Столбцы YPred содержите predictоценка вероятности, что изображение содержит конкретную цифру. Таким образом, первый столбец содержит оценку вероятности, что данное изображение является цифрой 0, второй столбец содержит оценку вероятности, что изображение является цифрой 1, третий столбец содержит оценку вероятности, что изображение является цифрой 2 и так далее. Вы видите тот predictоценка вероятностей для правильных цифр - почти 1, и вероятность для любой другой цифры - почти 0. predict правильно оценивает первые 10 наблюдений как цифру 0.

Предварительно обученная сеть Load. JapaneseVowelsNet предварительно обученная сеть LSTM, обученная на японском наборе данных Vowels как описано в [1] и [2]. Это было обучено на последовательностях, отсортированных по длине последовательности с мини-пакетным размером 27.

load JapaneseVowelsNet

Просмотрите сетевую архитектуру.

net.Layers
ans = 
  5x1 Layer array with layers:

     1   'sequenceinput'   Sequence Input          Sequence input with 12 dimensions
     2   'lstm'            LSTM                    LSTM with 100 hidden units
     3   'fc'              Fully Connected         9 fully connected layer
     4   'softmax'         Softmax                 softmax
     5   'classoutput'     Classification Output   crossentropyex with '1' and 8 other classes

Загрузите тестовые данные.

[XTest,YTest] = japaneseVowelsTestData;

Сделайте предсказания на тестовых данных.

YPred = predict(net,XTest);

Просмотрите музыку предсказания к первым 10 последовательностям.

YPred(1:10,:)
ans = 10x9 single matrix

    0.9918    0.0000    0.0000    0.0000    0.0006    0.0010    0.0001    0.0006    0.0059
    0.9868    0.0000    0.0000    0.0000    0.0006    0.0010    0.0001    0.0010    0.0105
    0.9924    0.0000    0.0000    0.0000    0.0006    0.0010    0.0001    0.0006    0.0054
    0.9896    0.0000    0.0000    0.0000    0.0006    0.0009    0.0001    0.0007    0.0080
    0.9965    0.0000    0.0000    0.0000    0.0007    0.0009    0.0000    0.0003    0.0016
    0.9888    0.0000    0.0000    0.0000    0.0006    0.0010    0.0001    0.0008    0.0087
    0.9886    0.0000    0.0000    0.0000    0.0006    0.0010    0.0001    0.0008    0.0089
    0.9982    0.0000    0.0000    0.0000    0.0006    0.0007    0.0000    0.0001    0.0004
    0.9883    0.0000    0.0000    0.0000    0.0006    0.0010    0.0001    0.0008    0.0093
    0.9959    0.0000    0.0000    0.0000    0.0007    0.0011    0.0000    0.0004    0.0019

Сравните эти баллы предсказания с метками этих последовательностей. Функция присваивает высокие баллы предсказания правильному классу.

YTest(1:10)
ans = 10x1 categorical
     1 
     1 
     1 
     1 
     1 
     1 
     1 
     1 
     1 
     1 

Входные параметры

свернуть все

Обучивший сеть в виде SeriesNetwork или DAGNetwork объект. Можно получить обучивший сеть путем импорта предварительно обученной сети (например, при помощи googlenet функция) или по образованию ваше собственное сетевое использование trainNetwork.

Отобразите datastore в виде ImageDatastore объект.

ImageDatastore позволяет пакетное чтение JPG или упреждающую выборку использования файлов изображений PNG. Если вы используете пользовательскую функцию для чтения изображений, то ImageDatastore не выбирает с упреждением.

Совет

Использование augmentedImageDatastore для эффективной предварительной обработки изображений для глубокого обучения включая изменение размеров изображений.

Не используйте readFcn опция imageDatastore для предварительной обработки или изменения размеров, когда эта опция обычно значительно медленнее.

Datastore для данных, которые не помещаются в память, и предварительной обработки. Datastore должен возвратить данные в таблице или массиве ячеек. Формат datastore выход зависит от сетевой архитектуры.

Сетевая архитектураDatastore ВыходПример Выход
Один вход

Таблица или массив ячеек, где первый столбец задает предикторы.

Табличными элементами должны быть скаляры, векторы-строки или массивы ячеек 1 на 1, содержащие числовой массив.

Пользовательские хранилища данных должны вывести таблицы.

data = read(ds)
data =

  4×1 table

        Predictors    
    __________________

    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
data = read(ds)
data =

  4×1 cell array

    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
    {224×224×3 double}
Несколько вход

Массив ячеек, по крайней мере, с numInputs столбцы, где numInputs количество сетевых входных параметров.

Первый numInputs столбцы задают предикторы для каждого входа.

Распоряжение входных параметров дано InputNames свойство сети.

data = read(ds)
data =

  4×2 cell array

    {224×224×3 double}    {128×128×3 double}
    {224×224×3 double}    {128×128×3 double}
    {224×224×3 double}    {128×128×3 double}
    {224×224×3 double}    {128×128×3 double}

Формат предикторов зависит от типа данных.

ДанныеФормат предикторов
2D изображение

h-by-w-by-c числовой массив, где h, w и c являются высотой, шириной и количеством каналов изображения, соответственно.

3-D изображение

h-by-w-by-d-by-c числовой массив, где h, w, d и c являются высотой, шириной, глубиной и количеством каналов изображения, соответственно.

Векторная последовательность

c-by-s матрица, где c является количеством функций последовательности и s, является длиной последовательности.

1D последовательность изображений

h-by-c-by-s массив, где h и c соответствуют высоте и количеству каналов изображения, соответственно, и s, является длиной последовательности.

Каждая последовательность в мини-пакете должна иметь ту же длину последовательности.

2D последовательность изображений

h-by-w-by-c-by-s массив, где h, w и c соответствуют высоте, ширине, и количеству каналов изображения, соответственно, и s, является длиной последовательности.

Каждая последовательность в мини-пакете должна иметь ту же длину последовательности.

3-D последовательность изображений

h-by-w-by-d-by-c-by-s массив, где h, w, d и c соответствуют высоте, ширине, глубине, и количеству каналов изображения, соответственно, и s, является длиной последовательности.

Каждая последовательность в мини-пакете должна иметь ту же длину последовательности.

Функции

c-by-1 вектор-столбец, где c является количеством функций.

Для получения дополнительной информации смотрите Хранилища данных для Глубокого обучения.

Отобразите или покажите данные в виде числового массива. Размер массива зависит от типа входа:

Входной параметрОписание
2D изображенияh-by-w-by-c-by-N числовой массив, где h, w и c являются высотой, шириной, и количеством каналов изображений, соответственно, и N, является количеством изображений.
3-D изображенияh-by-w-by-d-by-c-by-N числовой массив, где h, w, d и c являются высотой, шириной, глубиной, и количеством каналов изображений, соответственно, и N, является количеством изображений.
ФункцииN-by-numFeatures числовой массив, где N является количеством наблюдений и numFeatures количество функций входных данных.

Если массив содержит NaNs, затем они распространены через сеть.

Для сетей с несколькими входными параметрами можно задать несколько массивов X1, …, XN, где N количество сетевых входных параметров и входа Xi соответствует сетевому входу net.InputNames(i).

Последовательность или данные временных рядов в виде N-by-1 массив ячеек числовых массивов, где N является количеством наблюдений, числовой массив, представляющий одну последовательность или datastore.

Для входа массива ячеек или числового массива размерности числовых массивов, содержащих последовательности, зависят от типа данных.

Входной параметрОписание
Векторные последовательностиc-by-s матрицы, где c является количеством функций последовательностей и s, является длиной последовательности.
1D последовательности изображенийh-by-c-by-s массивы, где h и c соответствуют высоте и количеству каналов изображений, соответственно, и s, является длиной последовательности.
2D последовательности изображенийh-by-w-by-c-by-s массивы, где h, w и c соответствуют высоте, ширине, и количеству каналов изображений, соответственно, и s, является длиной последовательности.
3-D последовательности изображенийh-by-w-by-d-by-c-by-s, где h, w, d и c соответствуют высоте, ширине, глубине, и количеству каналов 3-D изображений, соответственно, и s, является длиной последовательности.

Для входа datastore datastore должен возвратить данные как массив ячеек последовательностей или таблицы, первый столбец которой содержит последовательности. Размерности данных о последовательности должны соответствовать приведенной выше таблице.

Таблица изображения или данных о функции. Каждая строка в таблице соответствует наблюдению.

Расположение предикторов в столбцах таблицы зависит от типа входных данных.

Входной параметрПредикторы
Данные изображения
  • Путь к абсолютному или файлу прямого доступа к изображению в виде вектора символов в отдельном столбце

  • Изображение, заданное как 3-D числовой массив

Задайте предикторы в отдельном столбце.

Покажите данные

Числовой скаляр.

Задайте предикторы в первом numFeatures столбцы таблицы, где numFeatures количество функций входных данных.

Этот аргумент поддерживает сети с одним входом только.

Типы данных: table

Аргументы name-value

Пример: 'MiniBatchSize',256 задает мини-пакетный размер как 256.

Задайте дополнительную разделенную запятой пару Name,Value аргумент. Name имя аргумента и Value соответствующее значение. Name должен появиться в одинарных кавычках (' ').

Размер мини-пакетов, чтобы использовать для предсказания в виде положительного целого числа. Большие мини-пакетные размеры требуют большей памяти, но могут привести к более быстрым предсказаниям.

При создании предсказаний с последовательностями различных длин мини-пакетный размер может повлиять на объем дополнения добавленного к входным данным, которые могут привести к различным ожидаемым значениям. Попытайтесь использовать различные значения, чтобы видеть, который работает лучше всего с вашей сетью. Чтобы задать мини-пакетный размер и дополнительные опции, используйте 'MiniBatchSize' и 'SequenceLength' опции, соответственно.

Пример: 'MiniBatchSize',256

Оптимизация эффективности в виде разделенной запятой пары, состоящей из 'Acceleration' и одно из следующего:

  • 'auto' — Автоматически примените много оптимизации, подходящей для входной сети и аппаратных ресурсов.

  • 'mex' — Скомпилируйте и выполните MEX-функцию. Эта опция доступна при использовании графического процессора только. Используя графический процессор требует Parallel Computing Toolbox и поддерживаемого устройства графического процессора. Для получения информации о поддерживаемых устройствах смотрите Поддержку графического процессора Релизом (Parallel Computing Toolbox). Если Parallel Computing Toolbox или подходящий графический процессор не доступны, то программное обеспечение возвращает ошибку.

  • 'none' — Отключите все ускорение.

Опцией по умолчанию является 'auto'. Если 'auto' задан, MATLAB® применит много совместимой оптимизации. Если вы используете 'auto' опция, MATLAB никогда не генерирует MEX-функцию.

Используя 'Acceleration' опции 'auto' и 'mex' может предложить выигрыши в производительности, но за счет увеличенного начального времени выполнения. Последующие вызовы совместимыми параметрами быстрее. Используйте оптимизацию эффективности, когда вы запланируете вызвать функцию многократно с помощью новых входных данных.

'mex' опция генерирует и выполняет MEX-функцию на основе сети и параметров, используемых в вызове функции. У вас может быть несколько MEX-функций, сопоставленных с одной сетью одновременно. Очищение сетевой переменной также очищает любые MEX-функции, сопоставленные с той сетью.

'mex' опция только доступна, когда вы используете графический процессор. Ускорение MEX поддерживает одно выполнение графического процессора с помощью опции значения имени 'ExecutionEvironment','gpu' только.

Использовать 'mex' опция, необходимо было установить компилятор C/C++ и Интерфейс GPU Coder™ для пакета поддержки Библиотек Глубокого обучения. Установите пакет поддержки с помощью Add-On Explorer в MATLAB. Для инструкций по настройке смотрите Setup MEX (GPU Coder). GPU Coder не требуется.

'mex' опция не поддерживает все слои. Для списка поддерживаемых слоев смотрите Поддерживаемые Слои (GPU Coder). Только сети с imageInputLayer поддерживаются.

Вы не можете использовать MATLAB Compiler™, чтобы развернуть вашу сеть при использовании 'mex' опция.

Пример: 'Acceleration','mex'

Аппаратный ресурс в виде разделенной запятой пары, состоящей из 'ExecutionEnvironment' и одно из следующего:

  • 'auto' — Используйте графический процессор, если вы доступны; в противном случае используйте центральный процессор.

  • 'gpu' — Используйте графический процессор. Используя графический процессор требует Parallel Computing Toolbox и поддерживаемого устройства графического процессора. Для получения информации о поддерживаемых устройствах смотрите Поддержку графического процессора Релизом (Parallel Computing Toolbox). Если Parallel Computing Toolbox или подходящий графический процессор не доступны, то программное обеспечение возвращает ошибку.

  • 'cpu' — Используйте центральный процессор.

  • 'multi-gpu' — Используйте несколько графических процессоров на одной машине, с помощью локального параллельного пула на основе кластерного профиля по умолчанию. Если нет никакого текущего параллельного пула, программное обеспечение начинает параллельный пул с размера пула, равного количеству доступных графических процессоров.

  • 'parallel' — Используйте локальный или удаленный параллельный пул на основе своего кластерного профиля по умолчанию. Если нет никакого текущего параллельного пула, программное обеспечение запускает тот с помощью кластерного профиля по умолчанию. Если пул имеет доступ к графическим процессорам, то только рабочие с помощью уникального графического процессора выполняют расчет. Если пул не имеет графических процессоров, то расчет происходит на всех доступных рабочих центрального процессора вместо этого.

Для получения дополнительной информации о том, когда использовать различные среды выполнения, смотрите, Увеличивают Глубокое обучение параллельно, на графических процессорах, и в Облаке.

'gpu', 'multi-gpu', и 'parallel' опции требуют Parallel Computing Toolbox. Чтобы использовать графический процессор для глубокого обучения, у вас должно также быть поддерживаемое устройство графического процессора. Для получения информации о поддерживаемых устройствах смотрите Поддержку графического процессора Релизом (Parallel Computing Toolbox). Если вы выбираете одну из этих опций и Parallel Computing Toolbox, или подходящий графический процессор не доступен, то программное обеспечение возвращает ошибку.

'multi-gpu' и 'parallel' опции не поддерживают рекуррентные нейронные сети (RNNs), содержащий lstmLayer, bilstmLayer, или gruLayer объекты.

Пример: 'ExecutionEnvironment','cpu'

Опция, чтобы возвратить категориальные метки в виде true или false.

Если ReturnCategorical true, затем функция возвращает категориальные метки для классификации выходные слои. В противном случае функция возвращает музыку предсказания к классификации выходные слои.

Опция, чтобы заполнить, обрежьте или разделите входные последовательности в виде одного из следующего:

  • 'longest' — Заполните последовательности в каждом мини-пакете, чтобы иметь ту же длину как самая длинная последовательность. Эта опция не отбрасывает данных, хотя дополнение может ввести шум сети.

  • 'shortest' — Усеченные последовательности в каждом мини-пакете, чтобы иметь ту же длину как самая короткая последовательность. Эта опция гарантирует, что никакое дополнение не добавляется, за счет отбрасывания данных.

  • Положительное целое число — Для каждого мини-пакета, заполните последовательности к самому близкому кратному заданная длина, которая больше самой долгой длины последовательности в мини-пакете, и затем разделяет последовательности в меньшие последовательности заданной длины. Если разделение происходит, то программное обеспечение создает дополнительные мини-пакеты. Используйте эту опцию, если полные последовательности не умещаются в памяти. В качестве альтернативы попытайтесь сократить количество последовательностей на мини-пакет путем установки 'MiniBatchSize' опция к нижнему значению.

Чтобы узнать больше об эффекте дополнения, усечение и разделение входных последовательностей, видят, что Последовательность Дополняет, Усечение, и Разделяет.

Пример: 'SequenceLength','shortest'

Направление дополнения или усечения в виде одного из следующего:

  • 'right' — Заполните или обрежьте последовательности справа. Последовательности запускают одновременно шаг, и программное обеспечение обрезает или добавляет дополнение в конец последовательностей.

  • 'left' — Заполните или обрежьте последовательности слева. Программное обеспечение обрезает или добавляет дополнение в запуск последовательностей так, чтобы конец последовательностей одновременно продвинулся.

Поскольку слои LSTM обрабатывают данные о последовательности один временной шаг за один раз, когда слой OutputMode свойством является 'last', любое дополнение в итоговых временных шагах может негативно влиять на слой выход. Чтобы заполнить или обрезать данные о последовательности слева, установите 'SequencePaddingDirection' опция к 'left'.

Для сетей от последовательности к последовательности (когда OutputMode свойством является 'sequence' для каждого слоя LSTM), любой дополняющий в первых временных шагах может негативно влиять на предсказания для более ранних временных шагов. Чтобы заполнить или обрезать данные о последовательности справа, установите 'SequencePaddingDirection' опция к 'right'.

Чтобы узнать больше об эффекте дополнения, усечение и разделение входных последовательностей, видят, что Последовательность Дополняет, Усечение, и Разделяет.

Значение, которым можно заполнить входные последовательности в виде скаляра. Опция допустима только когда SequenceLength 'longest' или положительное целое число. Не заполняйте последовательности NaN, потому что выполнение так может распространить ошибки в сети.

Пример: 'SequencePaddingValue',-1

Выходные аргументы

свернуть все

Предсказанные баллы или ответы, возвращенные как матрица, 4-D числовой массив или массив ячеек матриц. Формат YPred зависит от типа проблемы.

Следующая таблица описывает формат для проблем классификации.

ЗадачаФормат
Отобразите классификациюN-by-K матрица, где N является количеством наблюдений и K, является количеством классов
Классификация последовательностей к метке
Покажите классификацию
Классификация от последовательности к последовательности

N-by-1 массив ячеек матриц, где N является количеством наблюдений. Последовательности являются матрицами со строками K, где K является количеством классов. Каждая последовательность имеет то же количество временных шагов как соответствующая входная последовательность после применения SequenceLength опция к каждому мини-пакету независимо.

Следующая таблица описывает формат для проблем регрессии.

ЗадачаФормат
2D регрессия изображений
  • N-by-R матрица, где N является количеством изображений и R, является количеством ответов.

  • h-by-w-by-c-by-N числовой массив, где h, w и c являются высотой, шириной, и количеством каналов изображений, соответственно, и N, является количеством изображений.

3-D регрессия изображений
  • N-by-R матрица, где N является количеством изображений и R, является количеством ответов.

  • h-by-w-by-d-by-c-by-N числовой массив, где h, w, d и c являются высотой, шириной, глубиной, и количеством каналов изображений, соответственно, и N, является количеством изображений.

Регрессия Sequence-oneN-by-R матрица, где N является количеством последовательностей и R, является количеством ответов.
Регрессия от последовательности к последовательности

N-by-1 массив ячеек числовых последовательностей, где N является количеством последовательностей. Последовательности являются матрицами со строками R, где R является количеством ответов. Каждая последовательность имеет то же количество временных шагов как соответствующая входная последовательность после применения SequenceLength опция к каждому мини-пакету независимо.

Для задач регрессии от последовательности к последовательности с одним наблюдением, sequences может быть матрица. В этом случае, YPred матрица ответов.

Покажите регрессию

N-by-R матрица, где N является количеством наблюдений и R, является количеством ответов.

Для проблем регрессии от последовательности к последовательности с одним наблюдением, sequences может быть матрица. В этом случае, YPred матрица ответов.

Алгоритмы

Если данные изображения содержат NaNs, predict распространяет их через сеть. Если сеть имеет слои ReLU, эти слои игнорируют NaNs. Однако, если сеть не имеет слоя ReLU, то predict возвращает NaNs как предсказания.

Когда вы обучаете сеть с помощью trainNetwork функция, или когда вы используете предсказание или функции валидации с DAGNetwork и SeriesNetwork объекты, программное обеспечение выполняет эти расчеты с помощью арифметики с плавающей точкой, с одинарной точностью. Функции для обучения, предсказания и валидации включают trainNetwork, predict, classify, и activations. Программное обеспечение использует арифметику с одинарной точностью, когда вы обучаете нейронные сети с помощью и центральных процессоров и графических процессоров.

Альтернативы

Можно вычислить предсказанные баллы и предсказанные классы от обучившего сеть использования classify.

Можно также вычислить активации из использования слоя сети activations.

Для последовательности к метке и сетей классификации от последовательности к последовательности (например, сетей LSTM), можно сделать предсказания и обновить сетевое использование состояния classifyAndUpdateState и predictAndUpdateState.

Ссылки

[1] М. Кудо, J. Тояма, и М. Шимбо. "Многомерная Классификация Кривых Используя Прохождение через области". Буквы Распознавания образов. Издание 20, № 11-13, страницы 1103-1111.

[2] Репозиторий Машинного обучения UCI: японский Набор данных Гласных. https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels

Расширенные возможности

Введенный в R2016a