cvpartition

Данные секционирования для перекрестной проверки

Описание

cvpartition определяет случайный раздел в наборе данных. Этот раздел используется для определения обучающих и тестовых наборов для проверки статистической модели с использованием перекрестной проверки. Использовать training для извлечения учебных индексов и test для извлечения контрольных индексов для перекрестной проверки. Использовать repartition для определения нового случайного раздела того же типа, что и данный cvpartition объект.

Создание

Синтаксис

c = cvpartion (n, 'KFold', k)

c = cvpartion (n, 'Holdout', p)

c = cvpartion (группа, 'KFold', k)

c = cvpartion (группа, 'KFold', k, 'Stratify', stratifyOption)

c = cvpartion (группа, 'Holdout', p)

c = cvpartion (группа, 'Holdout', p, 'Stratify', стратий.Option)

c = cvpartion (n, 'Выход')

c = cvpartion (n, 'Повторное замещение')

Описание

c = cvpartition(n,'KFold',k) возвращает cvpartition объект c который определяет случайный нестратифицированный раздел для k-fold перекрестная проверка на n наблюдения. Раздел случайным образом делит наблюдения на k непересекающиеся подвыборы, или складки, каждая из которых имеет примерно одинаковое количество наблюдений.

пример

c = cvpartition(n,'Holdout',p) создает случайный нестратифицированный раздел для проверки удержания на n наблюдения. В этом разделе наблюдения делятся на обучающий набор и тестовый набор, или набор ожидания.

пример

c = cvpartition(group,'KFold',k) создает случайный раздел для стратифицированного k-текстовая перекрестная проверка. Каждая подгруппа, или складка, имеет приблизительно такое же количество наблюдений и содержит приблизительно те же пропорции классов, что и в group.

При указании group в качестве первого входного аргумента, cvpartition отбрасывает строки наблюдений, соответствующие отсутствующим значениям в group.

пример

c = cvpartition(group,'KFold',k,'Stratify',stratifyOption) возвращает cvpartition объект c который определяет случайный раздел для k-текстовая перекрестная проверка. При указании 'Stratify',false, то cvpartition игнорирует информацию о классе в group и создает нестратифицированный случайный раздел. В противном случае функция реализует расслоение по умолчанию.

c = cvpartition(group,'Holdout',p) случайным образом разбивает наблюдения на обучающий набор и тест, или тест, установленный со стратификацией, используя информацию о классе в group. Как учебные, так и тестовые наборы имеют приблизительно те же пропорции классов, что и в group.

пример

c = cvpartition(group,'Holdout',p,'Stratify',stratifyOption) возвращает объект c определяет случайное разбиение на обучающий набор и тестовый набор или набор ожидания. При указании 'Stratify',false, то cvpartition создает нестратифицированный случайный раздел. В противном случае функция реализует расслоение по умолчанию.

пример

c = cvpartition(n,'Leaveout') создает случайную секцию для перекрестной проверки при отказе n наблюдения. Отказ от отпуска является особым случаем 'KFold' в котором число складок равно количеству наблюдений.

c = cvpartition(n,'Resubstitution') создает объект c это не секционирует данные. Как учебный, так и тестовый набор содержат все исходные данные. n наблюдения.

Входные аргументы

развернуть все

`n` - Количество наблюдений
положительный целочисленный скаляр

Число наблюдений в выборке данных, указанное как положительный целочисленный скаляр.

Пример: 100

Типы данных: single | double

`k` - Количество складок
`10` (по умолчанию) | целочисленный скаляр

Число складок в секции, указанное как положительный целочисленный скаляр. k должно быть меньше общего числа наблюдений.

Пример: 5

Типы данных: single | double

`p` - Доля или количество наблюдений в тестовом наборе
`0.1` (по умолчанию) | скаляр в диапазоне (0,1) | целочисленный скаляр в диапазоне [1, n

)

Доля или количество наблюдений в тестовом наборе, используемом для проверки удержания, указанное как скаляр в диапазоне (0,1) или целочисленный скаляр в диапазоне [1, n), где n - общее число наблюдений.

Если p является скаляром в диапазоне (0,1), то cvpartition случайным образом выбирает приблизительно p*n наблюдения для тестового набора.
Если p является целым скаляром в диапазоне [1, n), тоcvpartition случайным образом выбирает p наблюдения для тестового набора.

Пример: 0.2

Пример: 50

Типы данных: single | double

`group` - Группировка переменных для стратификации
числовой вектор | логический вектор | категориальный массив | символьный массив | строковый массив | клеточный массив символьных векторов

Группирующая переменная для стратификации, заданная как числовой или логический вектор, категориальный, символьный или строковый массив или массив ячеек символьных векторов, указывающих класс каждого наблюдения. cvpartition создает секцию из наблюдений в group.

`stratifyOption` - Показатель стратификации
`true` | `false`

Показатель стратификации, указанный как true или false.

Если первый входной аргумент для cvpartition является group, то cvpartition реализует расслоение по умолчанию ('Stratify',true). Для нестратифицированного случайного раздела укажите 'Stratify',false.
Если первый входной аргумент для cvpartition является n, то cvpartition всегда создает нестратифицированный случайный раздел ('Stratify',false). В этом случае невозможно указать 'Stratify',true.

Типы данных: logical