Ограничения и предостережения

Вы обычно использовали бы обучение Levenberg-Marquardt малым и средним сетям размера, если вы имеете достаточно памяти в наличии. Если память является проблемой, то существует множество других доступных алгоритмов FAST. Для больших сетей вы, вероятно, захотите использовать trainscg или trainrp.

Многоуровневые сети способны к выполнению примерно любого линейного или нелинейного вычисления, и они могут аппроксимировать любую разумную функцию произвольно хорошо. Однако, в то время как сеть, обученная сила теоретически быть способной к выполнению правильно, обратной связи и ее изменениям, не может всегда находить решение. Смотрите страницу 12-8 [HDB96] для обсуждения сходимости к локальным минимальным точкам.

Ошибочная поверхность нелинейной сети является более комплексной, чем ошибочная поверхность линейной сети. Чтобы понять эту сложность, смотрите фигуры на страницах 12-5 к 12-7 из [HDB96], которые показывают три различных ошибочных поверхности для многоуровневой сети. Проблема состоит в том, что нелинейные передаточные функции в многоуровневых сетях вводят много локальных минимумов на ошибочной поверхности. Когда спуск градиента выполняется на ошибочной поверхности, в зависимости от начальных стартовых условий, это возможно для сетевого решения стать захваченным в одном из этих локальных минимумов. Урегулирование в локальном минимуме может быть хорошим или плохим в зависимости от того, как близко локальный минимум к глобальному минимуму и как низко ошибка требуется. В любом случае предостерегите, что несмотря на то, что многоуровневая сеть обратной связи с достаточными нейронами может реализовать примерно любую функцию, обратная связь не всегда находит правильные веса для оптимального решения. Вы можете хотеть повторно инициализировать сеть и переобучиться несколько раз, чтобы гарантировать, что у вас есть лучшее решение.

Сети также чувствительны к количеству нейронов в их скрытых слоях. Слишком мало нейронов может привести к underfitting. Слишком много нейронов могут способствовать сверхподбору кривой, в котором хорошо адаптированы все учебные точки, но подходящая кривая колеблется дико между этими точками. Способы иметь дело с различными из этих проблем обсуждены в, Улучшают Мелкое Обобщение Нейронной сети и Стараются не Сверхсоответствовать. Эта тема также обсуждена, начав на странице 11-21 [HDB96].

Для получения дополнительной информации о рабочем процессе с многоуровневыми сетями, смотрите Многоуровневые Мелкие Нейронные сети и Обучение Обратной связи.

Документация Deep Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.