Machine learning учит компьютеры делать то, что прибывает естественно к людям: учитесь на опыте. Алгоритмы машинного обучения используют вычислительные методы, чтобы “узнать” об информации непосредственно из данных, не полагаясь на предопределенное уравнение как на модель. Алгоритмы адаптивно улучшают свою производительность как количество выборок, доступных для изучения увеличений.
Машинное обучение использует два типа методов: контролируемое изучение, которое обучает модель на известных входных и выходных данных так, чтобы это могло предсказать будущие выходные параметры и безнадзорное изучение, которое находит спрятанным шаблоны или внутренние структуры во входных данных.
Цель машинного обучения с учителем состоит в том, чтобы создать модель, которая делает прогнозы на основе доказательства в присутствии неуверенности. Контролируемый алгоритм изучения берет известный набор входных данных и имеющихся откликов к данным (вывод) и обучает модель генерировать разумные прогнозы для ответа на новые данные. Контролируемое изучение использует классификацию и методы регрессии, чтобы разработать прогнозирующие модели.
Методы Classification предсказывают категориальные ответы, например, является ли электронное письмо подлинным или спам, или является ли опухоль злокачественной или доброкачественной. Модели классификации классифицируют входные данные в категории. Типовые приложения включают медицинскую обработку изображений, изображение и распознавание речи и рейтинг кредитоспособности.
Методы Regression предсказывают непрерывные ответы, например, изменения в температуре или колебания потребления энергии. Типовые приложения включают прогнозирование загрузки электричества и алгоритмическую торговлю.
Безнадзорное изучение находит спрятанным шаблоны или внутренние структуры в данных. Это используется, чтобы чертить выводы из наборов данных, состоящих из входных данных без маркированных ответов. Clustering является наиболее распространенным безнадзорным методом изучения. Это используется для исследовательского анализа данных, чтобы найти спрятанным шаблоны или группировки в данных. Приложения для кластеризации включают анализ последовательности генов, исследование рынка и алгоритм распознавания.
Выбор правильного алгоритма может казаться подавляющим — существуют десятки контролируемых и безнадзорных алгоритмов машинного обучения, и каждый проявляет другой подход к изучению. Нет никакого лучшего метода или един. Нахождение правильного алгоритма частично основано на методе проб и ошибок — даже высококвалифицированные специалисты по обработке и анализу данных не могут сказать, будет ли алгоритм работать, не испытывая его. Очень гибкие модели имеют тенденцию сверхсоответствовать данным путем моделирования незначительных изменений, которые могли быть шумом. Простые модели легче интерпретировать, но могут иметь более низкую точность. Поэтому выбор правильный алгоритм требует обменивания одного преимущества против другого, включая скорость модели, точность и сложность. Метод проб и ошибок в ядре машинного обучения — если один подход или алгоритм не работают, вы пробуете другого. MATLAB® обеспечивает инструменты, чтобы помочь вам испытать множество моделей машинного обучения и выбрать лучшее.
Чтобы найти, что приложения MATLAB и функции помогают вам решить задачи машинного обучения, консультируйтесь со следующей таблицей. Некоторые задачи машинного обучения сделаны легче при помощи приложений, и другие используют функции командной строки.
Задача | Приложения MATLAB и функции | Продукт | Узнать больше |
---|---|---|---|
Классификация, чтобы предсказать категориальные ответы | Используйте приложение Classification Learner, чтобы автоматически обучить выбор моделей и помочь вам выбрать лучшее. Можно сгенерировать код MATLAB, чтобы работать со скриптами. Для большего количества опций можно использовать интерфейс командной строки. | Statistics and Machine Learning Toolbox™ | Обучите модели классификации в приложении Classification Learner |
Регрессия, чтобы предсказать непрерывные ответы | Используйте приложение Regression Learner, чтобы автоматически обучить выбор моделей и помочь вам выбрать лучшее. Можно сгенерировать код MATLAB, чтобы работать со скриптами и другими функциональными опциями. Для большего количества опций можно использовать интерфейс командной строки. | Statistics and Machine Learning Toolbox | |
Кластеризация | Используйте функции кластерного анализа. | Statistics and Machine Learning Toolbox | Кластерный анализ |
Вычислительные финансовые задачи, такие как рейтинг кредитоспособности | Используйте инструменты для моделирования анализа кредитного риска. | Financial Toolbox™ Risk Management Toolbox™ | Кредитный риск (Financial Toolbox) |
Глубокое обучение для нейронных сетей для классификации и регрессии | Используйте предварительно обученные сети и функции, чтобы обучить сверточные нейронные сети. | Deep Learning Toolbox™ | Глубокое обучение в MATLAB (Deep Learning Toolbox) |
Распознавание лиц, обнаружение движения и обнаружение объектов | Используйте инструменты глубокого обучения для обработки изображений и компьютерного зрения. | Deep Learning Toolbox Computer Vision Toolbox™ | Глубокое обучение, семантическая сегментация и обнаружение (Computer Vision Toolbox) |
Следующий систематический рабочий процесс машинного обучения может помочь вам заняться проблемами машинного обучения. Можно завершить целый рабочий процесс в MATLAB.
Чтобы интегрировать лучшую обученную модель в промышленную систему, можно развернуть модели машинного обучения Statistics and Machine Learning Toolbox с помощью MATLAB Compiler™. Для многих моделей можно сгенерировать код С для прогноза с помощью MATLAB Coder™.
Используйте приложение Classification Learner, чтобы обучить модели классифицировать данные с помощью машинного обучения с учителем. Приложение позволяет вам исследовать машинное обучение с учителем в интерактивном режиме с помощью различных классификаторов.
Автоматически обучите выбор моделей и помогите вам выбрать лучшую модель. Типы модели включают деревья решений, дискриминантный анализ, поддержка векторные машины, логистическая регрессия, самые близкие соседи, наивный Бейес, и классификация ансамблей.
Исследуйте свои данные, задайте схемы валидации, выберите функции и визуализируйте результаты. По умолчанию приложение защищает от сверхподбора кривой путем применения перекрестной проверки. Также можно выбрать валидацию затяжки. Результаты валидации помогают вам выбрать лучшую модель для своих данных. Графики и критерии качества работы отражают подтвержденные образцовые результаты.
Экспортируйте модели в рабочую область, чтобы сделать прогнозы с новыми данными. Приложение всегда обучает модель на полных данных в дополнение к модели с заданной схемой валидации, и полная модель является моделью, которую вы экспортируете.
Сгенерируйте код MATLAB из приложения, чтобы создать скрипты, train с новыми данными, работать с огромными наборами данных или изменить код для последующего анализа.
Чтобы узнать больше, см. Модели Классификации Train в Приложении Classification Learner.
Для большего количества опций можно использовать интерфейс командной строки. Смотрите Классификацию.
Используйте приложение Regression Learner, чтобы обучить модели предсказывать текущие данные с помощью машинного обучения с учителем. Приложение позволяет вам исследовать машинное обучение с учителем в интерактивном режиме с помощью различных моделей регрессии.
Автоматически обучите выбор моделей и помогите вам выбрать лучшую модель. Типы модели включают модели линейной регрессии, деревья регрессии, Гауссовы модели регрессии процесса, поддержка векторные машины и ансамбли деревьев регрессии.
Исследуйте свои данные, выберите функции и визуализируйте результаты. Подобно Classification Learner Regression Learner применяет перекрестную проверку по умолчанию. Результаты и визуализация отражают подтвержденную модель. Используйте результаты выбрать лучшую модель для ваших данных.
Экспортируйте модели в рабочую область, чтобы сделать прогнозы с новыми данными. Приложение всегда обучает модель на полных данных в дополнение к модели с заданной схемой валидации, и полная модель является моделью, которую вы экспортируете.
Сгенерируйте код MATLAB из приложения, чтобы создать скрипты, train с новыми данными, работать с огромными наборами данных или изменить код для последующего анализа.
Чтобы узнать больше, см. Модели Регрессии Train в Приложении Regression Learner.
Для большего количества опций можно использовать интерфейс командной строки. Смотрите Регрессию.
Deep Learning Toolbox позволяет вам выполнить глубокое обучение для сверточных нейронных сетей для классификации, регрессии, выделения признаков и изучения передачи. Тулбокс обеспечивает простые команды MATLAB для создания и соединения слоев глубокой нейронной сети. Примеры и предварительно обученные сети дают возможность использовать MATLAB для глубокого обучения, даже без обширных знаний усовершенствованных алгоритмов компьютерного зрения или нейронных сетей.
Чтобы узнать больше, смотрите Глубокое обучение в MATLAB (Deep Learning Toolbox).