lime

Локальные поддающиеся толкованию объяснения модели агностические (LIME)

Описание

LIME объясняет предсказание модели машинного обучения (классификация или регрессия) для точки запроса, находя важные предикторы и подбирая простую поддающуюся толкованию модель.

Можно создать lime объект для модели машинного обучения с заданной точкой запроса (queryPoint) и конкретное количество важных предикторов (numImportantPredictors). Программное обеспечение генерирует синтетический набор данных и подбирает простую поддающуюся толкованию модель важных предикторов, которая эффективно объясняет предсказания для синтетических данных вокруг точки запроса. Простая модель может быть линейной моделью (значение по умолчанию) или модель дерева принятия решения.

Используйте подбиравшую простую модель, чтобы объяснить предсказание модели машинного обучения локально в заданной точке запроса. Используйте plot функция, чтобы визуализировать результаты LIME. На основе локальных объяснений можно решить, доверять ли модели машинного обучения.

Подбирайте новую простую модель для другой точки запроса при помощи fit функция.

Создание

Синтаксис

results = lime(blackbox)

results = lime(blackbox,X)

results = lime(blackbox,'CustomSyntheticData',customSyntheticData)

results = lime(___,'QueryPoint',queryPoint,'NumImportantPredictors',numImportantPredictors)

results = lime(___,Name,Value)

Описание

пример

results = lime(blackbox) создает lime объект с помощью объекта модели машинного обучения blackbox это содержит данные о предикторе. lime функция генерирует выборки синтетического набора данных предиктора и вычисляет предсказания для выборок. Чтобы подбирать простую модель, используйте fit функция с results.

пример

results = lime(blackbox,X) создает lime объект с помощью данных о предикторе в X.

results = lime(blackbox,'CustomSyntheticData',customSyntheticData) создает lime объект с помощью предсгенерированного, пользовательского синтетического набора данных предиктора customSyntheticData. lime функция вычисляет предсказания для выборок в customSyntheticData.

пример

results = lime(___,'QueryPoint',queryPoint,'NumImportantPredictors',numImportantPredictors) также находит конкретное количество важных предикторов и подбирает линейную простую модель для точки запроса queryPoint. Можно задать queryPoint и numImportantPredictors в дополнение к любой из комбинаций входных аргументов в предыдущих синтаксисах.

results = lime(___,Name,Value) задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение". Например, 'SimpleModelType','tree' задает тип простой модели как модель дерева принятия решения.

Входные параметры

развернуть все

`blackbox` — Модель машинного обучения, которая будет интерпретирована
объект модели регрессии | объект модели классификации | указатель на функцию

Модель машинного обучения, которая будет интерпретирована в виде указателя на функцию или полной или компактной регрессии или объекта модели классификации.

Указатель на функцию — можно задать указатель на функцию, который принимает данные о предикторе и возвращает предсказание для каждого наблюдения в данных о предикторе. Необходимо обеспечить данные о предикторе с помощью X или customSyntheticData и задайте 'Type' аргумент пары "имя-значение".

Объект полной или компактной модели — можно задать полную или компактную регрессию или объект модели классификации, который имеет a predict объектная функция. Программное обеспечение использует predict функция, чтобы вычислить предсказания для точки запроса и синтетического набора данных предиктора.

Объект модели регрессии

Поддерживаемая модель	Полный или компактный объект модели регрессии
Ансамбль моделей регрессии	`RegressionEnsemble`, `RegressionBaggedEnsemble`, `CompactRegressionEnsemble`
Гауссова модель регрессии ядра использование случайного расширения функции	`RegressionKernel`
Гауссова регрессия процесса	`RegressionGP`, `CompactRegressionGP`
Линейная регрессия для высоко-размерных данных	`RegressionLinear`
Дерево регрессии	`RegressionTree`, `CompactRegressionTree`
Регрессия машины опорных векторов	`RegressionSVM`, `CompactRegressionSVM`

Объект модели классификации

Поддерживаемая модель	Полный или компактный объект модели классификации
Классификатор дискриминантного анализа	`ClassificationDiscriminant`, `CompactClassificationDiscriminant`
Модель Multiclass для машин опорных векторов или других классификаторов	`ClassificationECOC`, `CompactClassificationECOC`
Ансамбль учеников для классификации	`ClassificationEnsemble`, `CompactClassificationEnsemble`, `ClassificationBaggedEnsemble`
Гауссова модель классификации ядер использование случайного расширения функции	`ClassificationKernel`
k- соседний классификатор	`ClassificationKNN`
Линейная модель классификации	`ClassificationLinear`
Мультикласс наивная модель Bayes	`ClassificationNaiveBayes`, `CompactClassificationNaiveBayes`
Классификатор машины опорных векторов для и бинарной классификации одного класса	`ClassificationSVM`, `CompactClassificationSVM`
Дерево выбора из двух альтернатив для классификации мультиклассов	`ClassificationTree`, `CompactClassificationTree`

Если вы задаете объект компактной модели, который не содержит данные о предикторе, то необходимо обеспечить данные о предикторе с помощью X или customSyntheticData.
lime не поддерживает объект модели, обученный с разреженной матрицей. Когда вы обучаете модель, используйте полную числовую матрицу или таблицу для данных о предикторе, где строки соответствуют отдельным наблюдениям.

`X` — Данные о предикторе
числовая матрица | таблица

Данные о предикторе в виде числовой матрицы или таблицы. Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной.

X должно быть сопоставимо с данными о предикторе, которые обучили blackbox, сохраненный в любом blackbox.X или blackbox.Variables. Заданное значение не должно содержать переменную отклика.

X должен иметь совпадающие типы данных как переменные предикторы (например, trainX) это обучило blackbox. Переменные, которые составляют столбцы X должен иметь тот же номер и порядок как в trainX.
- Если вы обучаете blackbox использование числовой матрицы, затем X должна быть числовая матрица.
- Если вы обучаете blackbox использование таблицы, затем X должна быть таблица. Все переменные предикторы в X должен иметь те же имена переменных и типы данных как в trainX.
lime не поддерживает разреженную матрицу.

Если blackbox компактный объект модели машинного обучения или указатель на функцию, необходимо обеспечить X или customSyntheticData. Если blackbox полный объект модели машинного обучения, и вы задаете этот аргумент, затем lime не использует данные о предикторе в blackbox. это использует заданные данные о предикторе только.

Типы данных: single | double

`customSyntheticData` — Предсгенерированный, пользовательский синтетический набор данных предиктора
`[]` (значение по умолчанию) | числовая матрица | таблица

Предсгенерированный, пользовательский синтетический набор данных предиктора в виде числовой матрицы или таблицы.

Если вы обеспечиваете предсгенерированный набор данных, то lime использует набор предоставленных данных вместо того, чтобы генерировать новый синтетический набор данных предиктора.

customSyntheticData должно быть сопоставимо с данными о предикторе, которые обучили blackbox, сохраненный в любом blackbox.X или blackbox.Variables. Заданное значение не должно содержать переменную отклика.

customSyntheticData должен иметь совпадающие типы данных как переменные предикторы (например, trainX) это обучило blackbox. Переменные, которые составляют столбцы customSyntheticData должен иметь тот же номер и порядок как в trainX
- Если вы обучаете blackbox использование числовой матрицы, затем customSyntheticData должна быть числовая матрица.
- Если вы обучаете blackbox использование таблицы, затем customSyntheticData должна быть таблица. Все переменные предикторы в customSyntheticData должен иметь те же имена переменных и типы данных как в trainX.
lime не поддерживает разреженную матрицу.

Если blackbox компактный объект модели машинного обучения или указатель на функцию, необходимо обеспечить X или customSyntheticData. Если blackbox полный объект модели машинного обучения, и вы задаете этот аргумент, затем lime не использует данные о предикторе в blackbox; это использует заданные данные о предикторе только.

Типы данных: single | double | table

`queryPoint` — Точка запроса
вектор-строка из числовых значений | таблица одной строки

Точка запроса, в который lime объясняет предсказание в виде вектора-строки из числовых значений или таблицы одной строки. queryPoint должен иметь совпадающий тип данных и количество столбцов как X, customSyntheticData, или данные о предикторе в blackbox.

Если вы задаете numImportantPredictors и queryPoint, затем lime функция подбирает простую модель при создании lime объект.

Пример: blackbox.X(1,:) задает точку запроса как первое наблюдение за данными о предикторе в полной модели blackbox машинного обучения.

Типы данных: single | double | table

`numImportantPredictors` — Количество важных предикторов, чтобы использовать в простой модели
положительное значение целочисленного скаляра

Количество важных предикторов, чтобы использовать в простой модели в виде положительного значения целочисленного скаляра.

Если 'SimpleModelType' 'linear', затем программное обеспечение выбирает конкретное количество важных предикторов и подбирает линейную модель выбранных предикторов.
Если 'SimpleModelType' 'tree', затем программное обеспечение задает максимальное количество разделений решения (или узлы ветви) как количество важных предикторов так, чтобы подходящее дерево решений использовало самое большее конкретное количество предикторов.

Если вы задаете numImportantPredictors и queryPoint, затем lime функция подбирает простую модель при создании lime объект.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: lime(blackbox, 'QueryPoint', q, 'NumImportantPredictors', n, 'SimpleModelType', 'дерево') задает точку запроса как q, количество важных предикторов, чтобы использовать для простой модели как n, и тип простой модели как модель дерева принятия решения. lime генерирует выборки синтетического набора данных предиктора, вычисляет предсказания для выборок и соответствует модели дерева принятия решения для точки запроса, использующей самое большее конкретное количество предикторов.

Опции для синтетических данных о предикторе

развернуть все

`'DataLocality'` — Местность синтетических данных для генерации данных
`'global'` (значение по умолчанию) | `'local'`

Местность синтетических данных для генерации данных в виде разделенной запятой пары, состоящей из 'DataLocality' и 'global' или 'local'.

'global' — Программное обеспечение оценивает параметры распределения с помощью целого набора данных предиктора (X или данные о предикторе в blackbox). Программное обеспечение генерирует синтетический набор данных предиктора предполагаемыми параметрами и использует набор данных для простого подбора кривой модели любой точки запроса.
'local' — Программное обеспечение оценивает параметры распределения с помощью k - самые близкие соседи точки запроса, где k является 'NumNeighbors' значение. Программное обеспечение генерирует новый синтетический набор данных предиктора каждый раз, когда оно подбирает простую модель для заданной точки запроса.

Для получения дополнительной информации смотрите LIME.

Пример: 'DataLocality','local'

Типы данных: char | string

`'NumNeighbors'` — Количество соседей точки запроса
1 500 (значений по умолчанию) | положительное значение целочисленного скаляра

Количество соседей точки запроса в виде разделенной запятой пары, состоящей из 'NumNeighbors' и положительное значение целочисленного скаляра. Этот аргумент допустим только когда 'DataLocality' 'local'.

Если вы задаете значение, больше, чем количество наблюдений в наборе данных предиктора (X или данные о предикторе в blackbox), затем lime использование все наблюдения.

Пример: 'NumNeighbors',2000

Типы данных: single | double

`'NumSyntheticData'` — Количество выборок, чтобы сгенерировать для синтетического набора данных
5 000 (значений по умолчанию) | положительное значение целочисленного скаляра

Количество выборок, чтобы сгенерировать для синтетического набора данных в виде разделенной запятой пары, состоящей из 'NumSyntheticData' и положительное значение целочисленного скаляра. Этот аргумент допустим только когда 'DataLocality' 'local'.

Пример: 'NumSyntheticData',2500

Типы данных: single | double

Опции для простой модели

развернуть все

`'KernelWidth'` — Ширина ядра
0,75 (значения по умолчанию) | значение числового скаляра

Ширина ядра экспоненциала в квадрате (или Гауссов) ядро функционирует в виде разделенной запятой пары, состоящей из 'KernelWidth' и значение числового скаляра.

lime функция вычисляет расстояния между точкой запроса и выборками в синтетическом наборе данных предиктора, и затем преобразует расстояния до весов при помощи экспоненциальной функции ядра в квадрате. Если вы понижаете 'KernelWidth' значение, затем lime веса использования, которые более фокусируются на выборках около точки запроса. Для получения дополнительной информации смотрите LIME.

Пример: 'KernelWidth',0.5

Типы данных: single | double

`'SimpleModelType'` — Тип простой модели
`'linear'` (значение по умолчанию) | `'tree'`

Тип простой модели в виде разделенной запятой пары, состоящей из 'SimpleModelType' и 'linear' или 'tree'.

'linear' — Программное обеспечение подбирает линейную модель при помощи fitrlinear для регрессии или fitclinear для классификации.
'tree' — Программное обеспечение соответствует модели дерева принятия решения при помощи fitrtree для регрессии или fitctree для классификации.

Пример: 'SimpleModelType','tree'

Типы данных: char | string

Опции для модели машинного обучения

развернуть все

`'CategoricalPredictors'` — Категориальный список предикторов
вектор из положительных целых чисел | логический вектор | символьная матрица | массив строк | массив ячеек из символьных векторов | `'all'`

Категориальные предикторы перечисляют в виде разделенной запятой пары, состоящей из 'CategoricalPredictors' и одно из значений в этой таблице.

Значение	Описание
Вектор из положительных целых чисел	Каждая запись в векторе является значением индекса, соответствующим столбцу данных о предикторе, которые содержат категориальную переменную.
Логический вектор	`true` запись означает, что соответствующий столбец данных о предикторе является категориальной переменной.
Символьная матрица	Каждая строка матрицы является именем переменного предиктора. Имена должны совпадать с именами переменных данных о предикторе в форме таблицы. Заполните имена дополнительными пробелами, таким образом, каждая строка символьной матрицы имеет ту же длину.
Массив строк или массив ячеек из символьных векторов	Каждым элементом в массиве является имя переменного предиктора. Имена должны совпадать с именами переменных данных о предикторе в форме таблицы.
`'all'`	Все предикторы являются категориальными.

Если вы задаете blackbox как указатель на функцию, затем lime идентифицирует категориальные предикторы из данных о предикторе X или customSyntheticData. Если данные о предикторе находятся в таблице, lime принимает, что переменная является категориальной, если это - логический вектор, неупорядоченный категориальный вектор, символьный массив, массив строк или массив ячеек из символьных векторов. Если данные о предикторе являются матрицей, lime принимает, что все предикторы непрерывны. Чтобы идентифицировать любые другие предикторы как категориальные предикторы, задайте их при помощи 'CategoricalPredictors' аргумент пары "имя-значение".
Если вы задаете blackbox как регрессия или объект модели классификации, затем lime идентифицирует категориальные предикторы при помощи CategoricalPredictors свойство объекта модели.

lime не поддерживает упорядоченный категориальный предиктор.

Пример: 'CategoricalPredictors','all'

`'Type'` — Тип модели машинного обучения
`'regression` | `'classification'`

Тип модели машинного обучения в виде разделенной запятой пары, состоящей из 'Type' и 'regression или 'classification'.

Необходимо задать этот аргумент, когда вы задаете blackbox как указатель на функцию. Если вы задаете blackbox как регрессия или объект модели классификации, затем lime определяет 'Type' значение в зависимости от типа модели.

Пример: 'Type','classification'

Типы данных: char | string

Опции для вычислительных расстояний

развернуть все

`'Distance'` — Метрика расстояния
вектор символов | строковый скаляр | указатель на функцию

Метрика расстояния в виде разделенной запятой пары, состоящей из 'Distance' и вектор символов, строковый скаляр или указатель на функцию.

Если данные о предикторе включают только непрерывные переменные, то lime поддержки эти метрики расстояния.

Значение	Описание
`'euclidean'`	Евклидово расстояние.
`'seuclidean'`	Стандартизированное Евклидово расстояние. Каждое координатное различие между наблюдениями масштабируется путем деления на соответствующий элемент стандартного отклонения, `S = std(PD,'omitnan')`, где `PD` данные о предикторе или синтетические данные о предикторе. Чтобы задать различное масштабирование, используйте `'Scale'` аргумент пары "имя-значение".
`'mahalanobis'`	Расстояние Mahalanobis с помощью выборочной ковариации `PD`, `C = cov(PD,'omitrows')`. Чтобы изменить значение ковариационной матрицы, используйте `'Cov'` аргумент пары "имя-значение".
`'cityblock'`	Расстояние городского квартала.
`'minkowski'`	Расстояние Минковскего. Экспонента по умолчанию равняется 2. Чтобы задать различную экспоненту, используйте `'P'` аргумент пары "имя-значение".
`'chebychev'`	Расстояние Чебычева (максимум координируют различие).
`'cosine'`	Один минус косинус включенного угла между точками (обработанный как векторы).
`'correlation'`	Один минус корреляция выборки между точками (обработанный как последовательности значений).
`'spearman'`	Один минус порядковая корреляция демонстрационного Копьеносца между наблюдениями (обработанный как последовательности значений).
`@distfun`	Пользовательский указатель на функцию расстояния. Функция расстояния имеет форму function D2 = distfun(ZI,ZJ) % calculation of distance ... где `ZI` `1`- `t` вектор, содержащий одно наблюдение. `ZJ` `s`- `t` матрица, содержащая несколько наблюдений. `distfun` должен принять матричный `ZJ` с произвольным числом наблюдений. `D2` `s`- `1` вектор из расстояний и `D2(k)` расстояние между наблюдениями `ZI` и `ZJ(k,:)`. Если ваши данные не разреженны, можно обычно вычислять расстояние более быстро при помощи встроенной метрики расстояния вместо указателя на функцию.

Если данные о предикторе включают и непрерывные и категориальные переменные, то lime поддержки эти метрики расстояния.

Значение Описание
'goodall3'
Модифицированное расстояние Гудолла
'ofd'
Расстояние частоты вхождения

Значение	Описание
`'goodall3'`	Модифицированное расстояние Гудолла
`'ofd'`	Расстояние частоты вхождения

Для определений смотрите Метрики Расстояния.

Значением по умолчанию является 'euclidean' если данные о предикторе включают только непрерывные переменные или 'goodall3' если данные о предикторе включают и непрерывные и категориальные переменные.

Пример: 'Distance','ofd'

Типы данных: char | string | function_handle

`'Cov'` — Ковариационная матрица для метрики расстояния Mahalanobis
положительная определенная матрица

Ковариационная матрица для метрики расстояния Mahalanobis в виде разделенной запятой пары, состоящей из 'Cov' и K-by-K положительная определенная матрица, где K является количеством предикторов.

Этот аргумент допустим только если 'Distance' 'mahalanobis'.

'Cov' по умолчанию значением является cov(PD,'omitrows'), где PD данные о предикторе или синтетические данные о предикторе. Если вы не задаете 'Cov' значение, затем программное обеспечение использует различные ковариационные матрицы при вычислении расстояний и для данных о предикторе и для синтетических данных о предикторе.

Пример: 'Cov',eye(3)

Типы данных: single | double

`'P'` — Экспонента для метрики расстояния Минковскего
2 (значение по умолчанию) | положительная скалярная величина

Экспонента для метрики расстояния Минковскего в виде разделенной запятой пары, состоящей из 'P' и положительная скалярная величина.

Этот аргумент допустим только если 'Distance' 'minkowski'.

Пример: 'P',3

Типы данных: single | double

`'Scale'` — Значение масштабного коэффициента для стандартизированной Евклидовой метрики расстояния
неотрицательный числовой вектор

Значение масштабного коэффициента для стандартизированной Евклидовой метрики расстояния в виде разделенной запятой пары, состоящей из 'Scale' и неотрицательный числовой вектор из длины K, где K является количеством предикторов.

Этот аргумент допустим только если 'Distance' 'seuclidean'.

'Scale' по умолчанию значением является std(PD,'omitnan'), где PD данные о предикторе или синтетические данные о предикторе. Если вы не задаете 'Scale' значение, затем программное обеспечение использует различные масштабные коэффициенты при вычислении расстояний и для данных о предикторе и для синтетических данных о предикторе.

Пример: 'Scale',quantile(X,0.75) - quantile(X,0.25)

Типы данных: single | double

Свойства

развернуть все

Заданные свойства

Можно задать следующие свойства при создании lime объект.

`BlackboxModel` — Модель машинного обучения, которая будет интерпретирована
объект модели регрессии | объект модели классификации | указатель на функцию

Это свойство доступно только для чтения.

Модель машинного обучения, которая будет интерпретирована в виде регрессии или объекта модели классификации или указателя на функцию.

blackbox аргумент устанавливает это свойство.

`CategoricalPredictors` — Категориальные индексы предиктора
вектор из положительных целых чисел | `[]`

Это свойство доступно только для чтения.

Категориальные индексы предиктора в виде вектора из положительных целых чисел. CategoricalPredictors содержит значения индекса, соответствующие столбцам данных о предикторе, которые содержат категориальные предикторы. Если ни один из предикторов не является категориальным, то это свойство пусто ([]).

Если вы задаете blackbox использование указателя на функцию, затем lime идентифицирует категориальные предикторы из данных о предикторе X или customSyntheticData. Если вы задаете 'CategoricalPredictors' аргумент пары "имя-значение", затем аргумент устанавливает это свойство.
Если вы задаете blackbox как регрессия или объект модели классификации, затем lime определяет это свойство при помощи CategoricalPredictors свойство объекта модели.

lime не поддерживает упорядоченный категориальный предиктор.

Если 'SimpleModelType' 'linear'(значение по умолчанию), затем lime создает фиктивные переменные для каждого идентифицированного категориального предиктора. lime обрабатывает категорию заданной точки запроса как ссылочная группа и создает ту меньше фиктивной переменной, чем количество категорий. Для получения дополнительной информации смотрите Фиктивные Переменные с Reference Group.

Типы данных: single | double

`DataLocality` — Местность синтетических данных для генерации данных
`'global'` | `'local'`

Это свойство доступно только для чтения.

Местность синтетических данных для генерации данных в виде 'global' или 'local'.

'DataLocality' аргумент пары "имя-значение" устанавливает это свойство.

`NumImportantPredictors` — Количество важных предикторов, чтобы использовать в простой модели
положительное значение целочисленного скаляра

Это свойство доступно только для чтения.

Количество важных предикторов, чтобы использовать в простой модели (SimpleModel) в виде положительного значения целочисленного скаляра.

numImportantPredictors аргумент lime или numImportantPredictors аргумент fit наборы это свойство.

Типы данных: single | double

`NumSyntheticData` — Количество выборок в синтетическом наборе данных
положительное значение целочисленного скаляра

Это свойство доступно только для чтения.

Количество выборок в синтетическом наборе данных в виде положительного значения целочисленного скаляра.

Если вы задаете customSyntheticData, затем количество выборок в пользовательском синтетическом наборе данных устанавливает это свойство.
В противном случае, 'NumSyntheticData' аргумент пары "имя-значение" lime или 'NumSyntheticData' аргумент пары "имя-значение" fit наборы это свойство.

Типы данных: single | double

`QueryPoint` — Точка запроса
вектор-строка из числовых значений | таблица одной строки

Это свойство доступно только для чтения.

Точка запроса, в который lime объясняет предсказание с помощью простой модели (SimpleModel) в виде вектора-строки из числовых значений или таблицы одной строки.

queryPoint аргумент lime или queryPoint аргумент fit наборы это свойство.

Типы данных: single | double | table

`Type` — Тип модели машинного обучения
`'regression` | `'classification'`

Это свойство доступно только для чтения.

Тип модели машинного обучения (BlackboxModel) в виде 'regression или 'classification'.

Если вы задаете blackbox как регрессия или объект модели классификации, затем lime определяет это свойство в зависимости от типа модели.
Если вы задаете blackbox использование указателя на функцию, затем 'Type' аргумент пары "имя-значение" устанавливает это свойство.

`X` — Данные о предикторе
числовая матрица | таблица

Это свойство доступно только для чтения.

Данные о предикторе в виде числовой матрицы или таблицы.

Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной.

Если вы задаете X аргумент, затем аргумент устанавливает это свойство.
Если вы задаете customSyntheticData аргумент, затем это свойство пусто.
Если вы задаете blackbox как полный объект модели машинного обучения и не задают X или customSyntheticData, затем это значение свойства является данными о предикторе, используемыми, чтобы обучить blackbox.

Типы данных: single | double | table

Вычисленные свойства

Программное обеспечение вычисляет следующие свойства.

`BlackboxFitted` — Предсказание для точки запроса вычисляется моделью машинного обучения
скаляр

Это свойство доступно только для чтения.

Предсказание для точки запроса, вычисленной моделью машинного обучения (BlackboxModel) в виде скаляра.

`Fitted` — Предсказания для синтетических данных о предикторе вычисляются моделью машинного обучения
вектор

Это свойство доступно только для чтения.

Предсказания для синтетических данных о предикторе, вычисленных моделью машинного обучения (BlackboxModel) в виде вектора.

`ImportantPredictors` — Важные индексы предиктора
вектор из положительных целых чисел

Это свойство доступно только для чтения.

Важные индексы предиктора в виде вектора из положительных целых чисел. ImportantPredictors содержит значения индекса, соответствующие столбцам предикторов, используемых в простой модели (SimpleModel).

Типы данных: single | double

`SimpleModel` — Простая модель
`RegressionLinear` объект модели | `RegressionTree` объект модели | `ClassificationLinear` объект модели | `ClassificationTree` объект модели

Это свойство доступно только для чтения.

Простая модель в виде RegressionLinear, RegressionTree, ClassificationLinear, или ClassificationTree объект модели. lime определяет тип простого объекта модели в зависимости от типа модели машинного обучения (Type) и тип простой модели ('SimpleModelType').

`SimpleModelFitted` — Предсказание для точки запроса вычисляется простой моделью
скаляр

Это свойство доступно только для чтения.

Предсказание для точки запроса, вычисленной простой моделью (SimpleModel) в виде скаляра.

Если SimpleModel ClassificationLinear, затем SimpleModelFitted значение равняется 1 или –1.

SimpleModelFitted значение равняется 1, если предсказание из простой модели совпадает с BlackboxFitted (предсказание из модели машинного обучения).
SimpleModelFitted значение –1, если предсказание из простой модели отличается от BlackboxFitted. Если BlackboxFitted значением является A, затем plot функционируйте отображает SimpleModelFitted значение как Not A.

`SyntheticData` — Синтетические данные о предикторе
числовая матрица | таблица

Это свойство доступно только для чтения.

Синтетические данные о предикторе в виде числовой матрицы или таблицы.

Если вы задаете customSyntheticData входной параметр, затем аргумент устанавливает это свойство.
В противном случае, lime оценочные параметры распределения из данных о предикторе X и генерирует синтетический набор данных предиктора.

Типы данных: single | double | table

Функции объекта

`fit`	Подбирайте простую модель локальных поддающихся толкованию объяснений модели агностических (LIME)
`plot`	Постройте результаты локальных поддающихся толкованию объяснений модели агностических (LIME)

Примеры

свернуть все

Объясните предсказание с деревом решений простая модель

Скрипт Open Live Script

Обучите модель классификации и создайте lime возразите, что использует дерево решений простая модель. Когда вы создаете lime возразите, задайте точку запроса и количество важных предикторов так, чтобы программное обеспечение сгенерировало выборки синтетического набора данных и подбирало простую модель для точки запроса с важными предикторами. Затем отобразите предполагаемую важность предиктора в простой модели при помощи объектного функционального plot.

Загрузите CreditRating_Historical набор данных. Набор данных содержит идентификаторы клиентов и их финансовые отношения, промышленные метки и кредитные рейтинги.

tbl = readtable('CreditRating_Historical.dat');

Отобразите первые три строки таблицы.

head(tbl,3)

ans=3×8 table
     ID      WC_TA    RE_TA    EBIT_TA    MVE_BVTD    S_TA     Industry    Rating
    _____    _____    _____    _______    ________    _____    ________    ______

    62394    0.013    0.104     0.036      0.447      0.142       3        {'BB'}
    48608    0.232    0.335     0.062      1.969      0.281       8        {'A' }
    42444    0.311    0.367     0.074      1.935      0.366       1        {'A' }

Составьте таблицу переменных предикторов путем удаления столбцов идентификаторов клиентов и оценок от tbl.

tblX = removevars(tbl,["ID","Rating"]);

Обучите модель черного ящика кредитных рейтингов при помощи fitcecoc функция.

blackbox = fitcecoc(tblX,tbl.Rating,'CategoricalPredictors','Industry');

Создайте lime объект, который объясняет предсказание для последнего наблюдения с помощью дерева решений простая модель. Задайте 'NumImportantPredictors' как шесть, чтобы найти самое большее 6 важных предикторов. Если вы задаете 'QueryPoint' и 'NumImportantPredictors' значения, когда вы создаете lime объект, затем программное обеспечение генерирует выборки синтетического набора данных и подбирает простую поддающуюся толкованию модель к синтетическому набору данных. Ваши результаты могут варьироваться от показанных из-за случайности lime. Можно установить случайный seed при помощи rng для воспроизводимости.

queryPoint = tblX(end,:)

queryPoint=1×6 table
    WC_TA    RE_TA    EBIT_TA    MVE_BVTD    S_TA    Industry
    _____    _____    _______    ________    ____    ________

    0.239    0.463     0.065      2.924      0.34       2

results = lime(blackbox,'QueryPoint',queryPoint,'NumImportantPredictors',6, ...
    'CategoricalPredictors','Industry','SimpleModelType','tree')

results = 
  lime with properties:

             BlackboxModel: [1×1 ClassificationECOC]
              DataLocality: 'global'
     CategoricalPredictors: 6
                      Type: 'classification'
                         X: [3932×6 table]
                QueryPoint: [1×6 table]
    NumImportantPredictors: 6
          NumSyntheticData: 5000
             SyntheticData: [5000×6 table]
                    Fitted: {5000×1 cell}
               SimpleModel: [1×1 ClassificationTree]
       ImportantPredictors: [2 4]
            BlackboxFitted: {'AA'}
         SimpleModelFitted: {'AA'}

Постройте lime объект results при помощи объектного функционального plot. Чтобы отобразить существующее подчеркивание на любое имя предиктора, измените TickLabelInterpreter значение осей к 'none'.

f = plot(results);
f.CurrentAxes.TickLabelInterpreter = 'none';

График отображает два предсказания для точки запроса, которые соответствуют свойству BlackboxFitted и свойству SimpleModelFitted results.

Горизонтальный столбчатый график показывает отсортированные значения важности предиктора. lime находит финансовые переменные EBIT_TA отношения и WC_TA как важные предикторы для точки запроса.

Можно считать длины панели при помощи всплывающих подсказок или Свойств панели. Например, можно найти Bar объекты при помощи findobj функционируйте и добавьте метки в концы панелей при помощи text функция.

b = findobj(f,'Type','bar');
text(b.YEndPoints+0.001,b.XEndPoints,string(b.YData))

В качестве альтернативы можно отобразить содействующие значения в таблице с именами переменного предиктора.

imp = b.YData;
flipud(array2table(imp', ...
    'RowNames',f.CurrentAxes.YTickLabel,'VariableNames',{'Predictor Importance'}))

ans=2×1 table
                Predictor Importance
                ____________________

    MVE_BVTD          0.088695      
    RE_TA            0.0018228

Объясните предсказание с линейной простой моделью

Скрипт Open Live Script

Обучите модель регрессии и создайте lime возразите, что использует линейную простую модель. Когда вы создаете lime объект, если вы не задаете точку запроса и количество важных предикторов, затем программное обеспечение, генерирует выборки синтетического набора данных, но не подбирает простую модель. Используйте объектный функциональный fit подбирать простую модель для точки запроса. Затем отобразите коэффициенты подбиравшей линейной простой модели при помощи объектного функционального plot.

Загрузите carbig набор данных, который содержит измерения автомобилей, сделанных в 1970-х и в начале 1980-х..

load carbig

Составьте таблицу, содержащую переменные предикторы Acceleration, Cylinders, и так далее, а также переменная отклика MPG.

tbl = table(Acceleration,Cylinders,Displacement,Horsepower,Model_Year,Weight,MPG);

Удаление отсутствующих значений в наборе обучающих данных может помочь уменьшать потребление памяти и ускорить обучение fitrkernel функция. Удалите отсутствующие значения в tbl.

tbl = rmmissing(tbl);

Составьте таблицу переменных предикторов путем удаления переменной отклика из tbl.

tblX = removevars(tbl,'MPG');

Обучите модель черного ящика MPG при помощи fitrkernel функция, и создает lime объект. Задайте набор данных предиктора потому что mdl не содержит данные о предикторе. Ваши результаты могут варьироваться от показанных из-за случайности fitrkernel и lime. Можно установить случайный seed при помощи rng для воспроизводимости.

mdl = fitrkernel(tblX,tbl.MPG,'CategoricalPredictors',[2 5]);
results = lime(mdl,tblX,'CategoricalPredictors',[2 5])

results = 
  lime with properties:

             BlackboxModel: [1×1 RegressionKernel]
              DataLocality: 'global'
     CategoricalPredictors: [2 5]
                      Type: 'regression'
                         X: [392×6 table]
                QueryPoint: []
    NumImportantPredictors: []
          NumSyntheticData: 5000
             SyntheticData: [5000×6 table]
                    Fitted: [5000×1 double]
               SimpleModel: []
       ImportantPredictors: []
            BlackboxFitted: []
         SimpleModelFitted: []

results содержит сгенерированный синтетический набор данных. SimpleModel свойство пусто ([]).

Подбирайте линейную простую модель для первого наблюдения в tblX. Задайте количество важных предикторов, чтобы найти как 3.

queryPoint = tblX(1,:)

queryPoint=1×6 table
    Acceleration    Cylinders    Displacement    Horsepower    Model_Year    Weight
    ____________    _________    ____________    __________    __________    ______

         12             8            307            130            70         3504

results = fit(results,queryPoint,3);

f = plot(results);
f.CurrentAxes.TickLabelInterpreter = 'none';

Горизонтальный столбчатый график показывает содействующие значения простой модели, отсортированной по их абсолютным значениям. LIME находит Horsepower, Model_Year, и Cylinders как важные предикторы для точки запроса.

Подбирайте простые модели для нескольких точек запроса

Скрипт Open Live Script

Обучите модель классификации и создайте lime возразите, что использует дерево решений простая модель. Подбирайте многоуровневые модели для нескольких точек запроса.

tbl = readtable('CreditRating_Historical.dat');

Составьте таблицу переменных предикторов путем удаления столбцов идентификаторов клиентов и оценок от tbl.

tblX = removevars(tbl,["ID","Rating"]);

Обучите модель черного ящика кредитных рейтингов при помощи fitcecoc функция.

blackbox = fitcecoc(tblX,tbl.Rating,'CategoricalPredictors','Industry')

blackbox = 
  ClassificationECOC
           PredictorNames: {'WC_TA'  'RE_TA'  'EBIT_TA'  'MVE_BVTD'  'S_TA'  'Industry'}
             ResponseName: 'Y'
    CategoricalPredictors: 6
               ClassNames: {'A'  'AA'  'AAA'  'B'  'BB'  'BBB'  'CCC'}
           ScoreTransform: 'none'
           BinaryLearners: {21×1 cell}
               CodingName: 'onevsone'


  Properties, Methods

Создайте lime объект с blackbox модель. Ваши результаты могут варьироваться от показанных из-за случайности lime. Можно установить случайный seed при помощи rng для воспроизводимости.

results = lime(blackbox,'CategoricalPredictors','Industry');

Найдите две точки запроса, истинными номинальными значениями которых является AAA и B, соответственно.

queryPoint(1,:) = tblX(find(strcmp(tbl.Rating,'AAA'),1),:);
queryPoint(2,:) = tblX(find(strcmp(tbl.Rating,'B'),1),:)

queryPoint=2×6 table
    WC_TA    RE_TA    EBIT_TA    MVE_BVTD    S_TA     Industry
    _____    _____    _______    ________    _____    ________

    0.121    0.413     0.057      3.647      0.466       12   
    0.019    0.009     0.042      0.257      0.119        1

Подбирайте линейную простую модель для первой точки запроса. Определите номер важных предикторов к 4.

newresults1 = fit(results,queryPoint(1,:),4);

Постройте результаты LIME newresults1 для первой точки запроса. Чтобы отобразить существующее подчеркивание на любое имя предиктора, измените TickLabelInterpreter значение осей к 'none'.

f1 = plot(newresults1);
f1.CurrentAxes.TickLabelInterpreter = 'none';

Соответствуйте линейной модели дерева принятия решения для первой точки запроса.

newresults2 = fit(results,queryPoint(1,:),6,'SimpleModelType','tree');
f2 = plot(newresults2);
f2.CurrentAxes.TickLabelInterpreter = 'none';

Простые модели в newresults1 и newresults2 оба находят MVE_BVTD и RE_TA как важные предикторы.

Подбирайте линейную простую модель для второй точки запроса и постройте результаты LIME для второй точки запроса.

newresults3 = fit(results,queryPoint(2,:),4);
f3 = plot(newresults3);
f3.CurrentAxes.TickLabelInterpreter = 'none';

Предсказание от blackbox моделью является B, но предсказанием из простой модели не является B. Когда эти два предсказания различные, можно задать меньший 'KernelWidth' значение. Программное обеспечение подбирает простую модель с помощью весов, которые более фокусируются на выборках около точки запроса. Если точка запроса является выбросом или расположена около контура решения, то два значения предсказания могут отличаться, даже если вы задаете маленький 'KernelWidth' значение. В таком случае можно изменить другие аргументы пары "имя-значение". Например, можно сгенерировать локальный синтетический набор данных (задайте 'DataLocality' из lime как 'local') для точки запроса и увеличивают число выборок ('NumSyntheticData' из lime или fit) в синтетическом наборе данных. Можно также использовать различную метрику расстояния ('Distance' из lime или fit).

Подбирайте линейную простую модель с маленьким 'KernelWidth' значение.

newresults4 = fit(results,queryPoint(2,:),4,'KernelWidth',0.01);
f4 = plot(newresults4);
f4.CurrentAxes.TickLabelInterpreter = 'none';

Кредитными рейтингами для первых и вторых точек запроса является AAA и B, соответственно. Простые модели в newresults1 и newresults4 оба находят MVE_BVTD, RE_TA, и WC_TA как важные предикторы. Однако их содействующие значения отличаются. Графики показывают, что эти предикторы действуют по-другому в зависимости от кредитных рейтингов.

Больше о

развернуть все

Метрики расстояния

Метрика расстояния является функцией, которая задает расстояние между двумя наблюдениями. lime поддерживает различные метрики расстояния для непрерывных переменных и соединения непрерывных и категориальных переменных.

Метрики расстояния для непрерывных переменных
Учитывая mx-by-n матрица данных X, который обработан как mx (1 n) векторы-строки _x1, _x2..., _xmx и my-by-n матрица данных Y, который обработан как my (1 n) векторы-строки _y1, _y2..., _ymy, определяются следующим образом различные расстояния между векторным _xs и _yt:
- Евклидово расстояние
  $d_{s t}^{2} = (x_{s} - y_{t}) (x_{s} - y_{t})^{'} .$
  Евклидово расстояние является особым случаем расстояния Минковскего, где p = 2.
- Стандартизированное Евклидово расстояние
  $d_{s t}^{2} = (x_{s} - y_{t}) V^{- 1} (x_{s} - y_{t})^{'},$
  где V является n-by-n диагональная матрица, j которой th диагональный элемент (S (j)) ², где S является вектором из масштабных коэффициентов для каждой размерности.
- Расстояние Mahalanobis
  $d_{s t}^{2} = (x_{s} - y_{t}) C^{- 1} (x_{s} - y_{t})^{'},$
  где C является ковариационной матрицей.
- Расстояние городского квартала
  $d_{s t} = \sum_{j = 1}^{n} | x_{s j} - y_{t j} | .$
  Расстояние городского квартала является особым случаем расстояния Минковскего, где p = 1.
- Расстояние Минковскего
  $d_{s t} = \sqrt[p]{\sum_{j = 1}^{n} {| x_{s j} - y_{t j} |}^{p}} .$
  Для особого случая p = 1, расстояние Минковскего дает расстояние городского квартала. Для особого случая p = 2, расстояние Минковскего дает Евклидово расстояние. Для особого случая p = ∞, расстояние Минковскего дает расстояние Чебычева.
- Расстояние Чебычева
  $d_{s t} = \max_{j} {| x_{s j} - y_{t j} |} .$
  Расстояние Чебычева является особым случаем расстояния Минковскего, где p = ∞.
- Расстояние косинуса
  $d_{s t} = (1 - \frac{x_{s} {y^{'}}_{t}}{\sqrt{(x_{s} {x^{'}}_{s}) (y_{t} {y^{'}}_{t})}}) .$
- Расстояние корреляции
  $d_{s t} = 1 - \frac{(x_{s} - {\bar{x}}_{s}) {(y_{t} - {\bar{y}}_{t})}^{'}}{\sqrt{(x_{s} - {\bar{x}}_{s}) {(x_{s} - {\bar{x}}_{s})}^{'}} \sqrt{(y_{t} - {\bar{y}}_{t}) {(y_{t} - {\bar{y}}_{t})}^{'}}},$
  где
  ${\bar{x}}_{s} = \frac{1}{n} \sum_{j} x_{s j}$
  и
  ${\bar{y}}_{t} = \frac{1}{n} \sum_{j} y_{t j} .$
- Расстояние копьеносца
  $d_{s t} = 1 - \frac{(r_{s} - {\bar{r}}_{s}) {(r_{t} - {\bar{r}}_{t})}^{'}}{\sqrt{(r_{s} - {\bar{r}}_{s}) {(r_{s} - {\bar{r}}_{s})}^{'}} \sqrt{(r_{t} - {\bar{r}}_{t}) {(r_{t} - {\bar{r}}_{t})}^{'}}},$
  где
  - _rsj является рангом _xsj, принятого x _1j, x _2j... _xmx,j, как вычислено tiedrank.
  - _rtj является рангом _ytj, принятого y _1j, y _2j... _ymy,j, как вычислено tiedrank.
  - _rs и _rt являются координатно-мудрыми векторами ранга из _xs и _yt, то есть, _rs = (_rs ₁, _rs ₂... _rsn) и _rt = (r _{t 1}, r _{t 2}... _rtn).
  - ${\bar{r}}_{s} = \frac{1}{n} \sum_{j} r_{s j} = \frac{(n + 1)}{2}$ .
  - ${\bar{r}}_{t} = \frac{1}{n} \sum_{j} r_{t j} = \frac{(n + 1)}{2}$ .
Метрики расстояния для соединения непрерывных и категориальных переменных
- Модифицированное расстояние Гудолла
  Это расстояние является вариантом расстояния Гудолла, которое присваивает маленькое расстояние, если совпадающие значения являются нечастыми независимо от частот других значений. Для несоответствий вклад расстояния предиктора равняется 1 / (количество переменных).
- Расстояние частоты вхождения
  Для соответствия расстояние частоты вхождения присваивает нулевое расстояние. Для несоответствия расстояние частоты вхождения присваивает более высокое расстояние на менее частом значении и более низкое расстояние на более частом значении.

Алгоритмы

развернуть все

ИЗВЕСТЬ

Чтобы объяснить предсказание модели машинного обучения использование LIME [1], программное обеспечение генерирует синтетический набор данных и подбирает простую поддающуюся толкованию модель к синтетическому набору данных при помощи lime и fit, как описано в шагах 1-5.

Если вы задаете queryPoint и numImportantPredictors значения lime, затем lime функция выполняет все шаги.
Если вы не задаете queryPoint и numImportantPredictors и задайте 'DataLocality' как 'global' (значение по умолчанию), затем lime функция генерирует синтетический набор данных (шаги 1-2), и fit функционируйте подбирает простую модель (шаги 3-5).
Если вы не задаете queryPoint и numImportantPredictors и задайте 'DataLocality' как 'local', затем fit функция выполняет все шаги.

lime и fit функции выполняют эти шаги:

Сгенерируйте синтетический набор данных предиктора _Xs с помощью многомерного нормального распределения для непрерывных переменных и распределения многочлена для каждой категориальной переменной. Можно задать количество выборок, чтобы сгенерировать при помощи 'NumSyntheticData' аргумент пары "имя-значение".
- Если 'DataLocality' 'global' (значение по умолчанию), затем программное обеспечение оценивает параметры распределения от целого набора данных предиктора (X или данные о предикторе в blackbox).
- Если 'DataLocality' 'local', затем программное обеспечение оценивает параметры распределения с помощью k - самые близкие соседи точки запроса, где k является 'NumNeighbors' значение. Можно задать метрику расстояния, чтобы найти самых близких соседей при помощи 'Distance' аргумент пары "имя-значение".
Программное обеспечение игнорирует отсутствующие значения в наборе данных предиктора при оценке параметров распределения.
В качестве альтернативы можно обеспечить предсгенерированный, пользовательский синтетический набор данных предиктора при помощи customSyntheticData входной параметр lime.
Вычислите предсказания _Ys для синтетического набора данных _Xs. Предсказания являются предсказанными ответами для регрессии или классифицированными метками для классификации. Программное обеспечение использует predict функция blackbox модель, чтобы вычислить предсказания. Если вы задаете blackbox как указатель на функцию, затем программное обеспечение вычисляет предсказания при помощи указателя на функцию.
Вычислите расстояния d между точкой запроса и выборками в синтетическом наборе данных предиктора с помощью метрики расстояния, заданной 'Distance'.
Вычислите значения веса _wq выборок в синтетическом наборе данных предиктора относительно точки запроса q с помощью экспоненциала в квадрате (или Гауссов) функция ядра

$w_{q} (x_{s}) = \exp (- \frac{1}{2} {(\frac{d (x_{s}, q)}{\sqrt{p} σ})}^{2}) .$
- _xs является выборкой в синтетическом наборе данных предиктора _Xs.
- d (_xs, q) является расстоянием между демонстрационным _xs и точкой запроса q.
- p является количеством предикторов в _Xs.
- σ является шириной ядра, которую можно задать при помощи 'KernelWidth' аргумент пары "имя-значение". 'KernelWidth' по умолчанию значение 0.75.
Значение веса в точке запроса равняется 1, и затем это сходится, чтобы обнулить как повышения стоимости расстояния. 'KernelWidth' значение управляет, как быстро значение веса сходится, чтобы обнулить. Ниже 'KernelWidth' значение, быстрее значение веса сходится, чтобы обнулить. Поэтому алгоритм дает больше веса выборкам около точки запроса. Поскольку этот алгоритм использует такие значения веса, выбранные важные предикторы и подбирал простую модель, эффективно объясняют предсказания для синтетических данных локально, вокруг точки запроса.
Подбирайте простую модель.
- Если 'SimpleModelType' 'linear' (значение по умолчанию), затем программное обеспечение выбирает важные предикторы и подбирает линейную модель выбранных важных предикторов.
  - Выберите n важные предикторы ( ${\tilde{X}}_{s}$ ) при помощи алгоритма ортогонального преследования соответствия (OMP) группы [2][3], где n является numImportantPredictors значение. Этот алгоритм использует синтетический набор данных предиктора (_Xs), предсказания (_Ys) и значения веса (_wq).
  - Подбирайте линейную модель выбранных важных предикторов ( ${\tilde{X}}_{s}$ ) к предсказаниям (_Ys) с помощью значений веса (_wq). Использование программного обеспечения fitrlinear для регрессии или fitclinear для классификации. Для модели мультикласса программное обеспечение использует one-all схему создать бинарную проблему классификации. Положительный класс является предсказанным классом для точки запроса от blackbox модель и отрицательный класс относятся к другим классам.
- Если 'SimpleModelType' 'tree', затем программное обеспечение соответствует модели дерева принятия решения при помощи fitrtree для регрессии или fitctree для классификации. Программное обеспечение задает максимальное количество разделений решения (или узлы ветви) как количество важных предикторов так, чтобы подходящее дерево решений использовало самое большее конкретное количество предикторов.

Ссылки

[1] Рибейру, Марко Тулио, С. Сингх и К. Гуестрин. "'Почему я должен Доверять Вам?': Объяснение Предсказаний Любого Классификатора". В Продолжениях 22-й Международной конференции ACM SIGKDD по вопросам Открытия Знаний и Анализа данных, 1135–44. Сан-Франциско Калифорнийские США: ACM, 2016.

[2] Świrszcz, Гжегож, Наоки Абэ и Орели К. Лозано. "Сгруппированное ортогональное соответствие с преследованием для выбора переменной и предсказания". Усовершенствования в нейронных системах обработки информации (2009): 1150–58.

[3] Лозано, Орели К., Гжегож Świrszcz и Наоки Абэ. "Группа ортогональное соответствие с преследованием для логистической регрессии". Продолжения четырнадцатой международной конференции по вопросам искусственного интеллекта и статистики (2011): 452–60.

Смотрите также

plotPartialDependence

Введенный в R2020b

Документация

lime

Описание

Создание

Синтаксис

Описание

Входные параметры

blackbox — Модель машинного обучения, которая будет интерпретирована объект модели регрессии | объект модели классификации | указатель на функцию

X — Данные о предикторе числовая матрица | таблица

customSyntheticData — Предсгенерированный, пользовательский синтетический набор данных предиктора [] (значение по умолчанию) | числовая матрица | таблица

queryPoint — Точка запроса вектор-строка из числовых значений | таблица одной строки

numImportantPredictors — Количество важных предикторов, чтобы использовать в простой модели положительное значение целочисленного скаляра

'DataLocality' — Местность синтетических данных для генерации данных 'global' (значение по умолчанию) | 'local'

'NumNeighbors' — Количество соседей точки запроса 1 500 (значений по умолчанию) | положительное значение целочисленного скаляра

'NumSyntheticData' — Количество выборок, чтобы сгенерировать для синтетического набора данных 5 000 (значений по умолчанию) | положительное значение целочисленного скаляра

'KernelWidth' — Ширина ядра 0,75 (значения по умолчанию) | значение числового скаляра

'SimpleModelType' — Тип простой модели 'linear' (значение по умолчанию) | 'tree'

'Type' — Тип модели машинного обучения 'regression | 'classification'

'Distance' — Метрика расстояния вектор символов | строковый скаляр | указатель на функцию

'Cov' — Ковариационная матрица для метрики расстояния Mahalanobis положительная определенная матрица

'P' — Экспонента для метрики расстояния Минковскего2 (значение по умолчанию) | положительная скалярная величина

'Scale' — Значение масштабного коэффициента для стандартизированной Евклидовой метрики расстояния неотрицательный числовой вектор

Свойства

Заданные свойства

BlackboxModel — Модель машинного обучения, которая будет интерпретирована объект модели регрессии | объект модели классификации | указатель на функцию

CategoricalPredictors — Категориальные индексы предиктора вектор из положительных целых чисел | []

DataLocality — Местность синтетических данных для генерации данных 'global' | 'local'

NumImportantPredictors — Количество важных предикторов, чтобы использовать в простой модели положительное значение целочисленного скаляра

NumSyntheticData — Количество выборок в синтетическом наборе данных положительное значение целочисленного скаляра

QueryPoint — Точка запроса вектор-строка из числовых значений | таблица одной строки

Type — Тип модели машинного обучения 'regression | 'classification'

X — Данные о предикторе числовая матрица | таблица

Вычисленные свойства

BlackboxFitted — Предсказание для точки запроса вычисляется моделью машинного обучения скаляр

Fitted — Предсказания для синтетических данных о предикторе вычисляются моделью машинного обучения вектор

ImportantPredictors — Важные индексы предиктора вектор из положительных целых чисел

SimpleModel — Простая модель RegressionLinear объект модели | RegressionTree объект модели | ClassificationLinear объект модели | ClassificationTree объект модели

SimpleModelFitted — Предсказание для точки запроса вычисляется простой моделью скаляр

SyntheticData — Синтетические данные о предикторе числовая матрица | таблица

Функции объекта

Примеры

Объясните предсказание с деревом решений простая модель

Объясните предсказание с линейной простой моделью

Подбирайте простые модели для нескольких точек запроса

Больше о

Метрики расстояния

Алгоритмы

ИЗВЕСТЬ

Ссылки

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

`blackbox` — Модель машинного обучения, которая будет интерпретирована
объект модели регрессии | объект модели классификации | указатель на функцию

`X` — Данные о предикторе
числовая матрица | таблица

`customSyntheticData` — Предсгенерированный, пользовательский синтетический набор данных предиктора
`[]` (значение по умолчанию) | числовая матрица | таблица

`queryPoint` — Точка запроса
вектор-строка из числовых значений | таблица одной строки

`numImportantPredictors` — Количество важных предикторов, чтобы использовать в простой модели
положительное значение целочисленного скаляра

`'DataLocality'` — Местность синтетических данных для генерации данных
`'global'` (значение по умолчанию) | `'local'`

`'NumNeighbors'` — Количество соседей точки запроса
1 500 (значений по умолчанию) | положительное значение целочисленного скаляра

`'KernelWidth'` — Ширина ядра
0,75 (значения по умолчанию) | значение числового скаляра

`'SimpleModelType'` — Тип простой модели
`'linear'` (значение по умолчанию) | `'tree'`

`'Type'` — Тип модели машинного обучения
`'regression` | `'classification'`

`'Distance'` — Метрика расстояния
вектор символов | строковый скаляр | указатель на функцию

`'Cov'` — Ковариационная матрица для метрики расстояния Mahalanobis
положительная определенная матрица

`'P'` — Экспонента для метрики расстояния Минковскего
2 (значение по умолчанию) | положительная скалярная величина

`'Scale'` — Значение масштабного коэффициента для стандартизированной Евклидовой метрики расстояния
неотрицательный числовой вектор

`BlackboxModel` — Модель машинного обучения, которая будет интерпретирована
объект модели регрессии | объект модели классификации | указатель на функцию

`CategoricalPredictors` — Категориальные индексы предиктора
вектор из положительных целых чисел | `[]`

`DataLocality` — Местность синтетических данных для генерации данных
`'global'` | `'local'`

`NumImportantPredictors` — Количество важных предикторов, чтобы использовать в простой модели
положительное значение целочисленного скаляра

`NumSyntheticData` — Количество выборок в синтетическом наборе данных
положительное значение целочисленного скаляра

`QueryPoint` — Точка запроса
вектор-строка из числовых значений | таблица одной строки

`Type` — Тип модели машинного обучения
`'regression` | `'classification'`

`X` — Данные о предикторе
числовая матрица | таблица

`BlackboxFitted` — Предсказание для точки запроса вычисляется моделью машинного обучения
скаляр

`Fitted` — Предсказания для синтетических данных о предикторе вычисляются моделью машинного обучения
вектор

`ImportantPredictors` — Важные индексы предиктора
вектор из положительных целых чисел

`SimpleModel` — Простая модель
`RegressionLinear` объект модели | `RegressionTree` объект модели | `ClassificationLinear` объект модели | `ClassificationTree` объект модели

`SimpleModelFitted` — Предсказание для точки запроса вычисляется простой моделью
скаляр

`SyntheticData` — Синтетические данные о предикторе
числовая матрица | таблица