random

Класс: GeneralizedLinearMixedModel

Сгенерируйте случайные ответы из подбиравшей обобщенной линейной модели смешанных эффектов

Описание

пример

ysim = random(glme) возвращает симулированные отклики, ysim, из подходящей обобщенной линейной модели glme смешанных эффектов, в точках первоначального проекта.

ysim = random(glme,tblnew) возвращает симулированные отклики с помощью новых входных значений, заданных в таблице или массиве набора данных, tblnew.

ysim = random(___,Name,Value) возвращает симулированные отклики с помощью дополнительных опций, заданных одним или несколькими Name,Value парные аргументы, с помощью любого из предыдущих синтаксисов. Например, можно задать веса наблюдения, биномиальные размеры или смещения для модели.

Входные параметры

развернуть все

Обобщенная линейная модель смешанных эффектов в виде GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта, смотрите GeneralizedLinearMixedModel.

Новые входные данные, который включает переменную отклика, переменные предикторы и сгруппированные переменные в виде массива набора данных или таблицы. Переменные предикторы могут быть непрерывными или сгруппированные переменные. tblnew должен содержать те же переменные как исходная таблица или массив набора данных, tbl, используемый, чтобы соответствовать обобщенной линейной модели glme смешанных эффектов.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Количество испытаний за биномиальное распределение в виде разделенной запятой пары, состоящей из 'BinomialSize' и m-by-1 вектор из положительных целочисленных значений, где m является количеством строк в tblnew. 'BinomialSize' пара "имя-значение" применяется только к биномиальному распределению. Значение задает количество биномиальных испытаний при генерации случайных значений отклика.

Типы данных: single | double

Смещение модели в виде вектора из скалярных значений длины m, где m является количеством строк в tblnew. Смещение используется в качестве дополнительного предиктора и зафиксировало содействующее значение в 1.

Веса наблюдения в виде разделенной запятой пары, состоящей из 'Weights' и m-by-1 вектор из неотрицательных скалярных значений, где m является количеством строк в tblnew. Если распределение ответа является биномом или Пуассоном, то 'Weights' должен быть вектор из положительных целых чисел.

Типы данных: single | double

Выходные аргументы

развернуть все

Значения симулированного отклика, возвращенные как m-by-1 вектор, где m является количеством строк в tblnew. random создает ysim первой генерацией вектора случайных эффектов на основе его подходящего предшествующего распределения. random затем генерирует ysim от его подходящего условного распределения, учитывая случайные эффекты. random учитывает, что эффект весов наблюдения задал при подборе кривой использованию модели fitglme,если таковые имеются.

Примеры

развернуть все

Загрузите выборочные данные.

load mfr

Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:

  • Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждого пакета, в часах (time)

  • Температура пакета, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (AB, или C) из химиката, используемого в пакете (supplier)

  • Количество дефектов в пакете (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.

Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включайте термин случайных эффектов для точки пересечения, сгруппированной factory, с учетом качественных различий, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты. Задайте фиктивную переменную, кодирующую как 'effects', таким образом, фиктивные переменные коэффициенты суммируют к 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной линейной модели смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в пакете, произведенном фабрикой i во время пакета j.

  • μij среднее количество дефектов, соответствующих фабрике i (где i=1,2,...,20) во время пакета j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij измерения для каждой переменной, которые соответствуют фабрике i во время пакета j. Например, newprocessij указывает ли пакет, произведенный фабрикой i во время пакета j используемый новый процесс.

  • supplier_Cij и supplier_Bij фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C или B, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой i во время пакета j.

  • biN(0,σb2) точка пересечения случайных эффектов для каждой фабрики i это составляет специфичное для фабрики изменение по качеству.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Используйте random симулировать новый вектор отклика от подобранной модели.

rng(0,'twister');  % For reproducibility
ynew = random(glme);

Отобразите первые 10 строк вектора симулированного отклика.

ynew(1:10)
ans = 10×1

     3
     3
     1
     7
     5
     8
     7
     9
     5
     9

Симулируйте новый вектор отклика с помощью новых входных значений. Составьте новую таблицу путем копирования первых 10 строк mfr в tblnew.

tblnew = mfr(1:10,:);

Первые 10 строк mfr включайте данные, собранные от испытаний 1 - 5 для фабрик 1 и 2. Обе фабрики использовали старый процесс для всех их испытаний во время эксперимента, таким образом, newprocess = 0 для всех 10 наблюдений.

Измените значение newprocess к 1 для наблюдений в tblnew.

tblnew.newprocess = ones(height(tblnew),1);

Симулируйте новые ответы с помощью новых входных значений в tblnew.

ynew2 = random(glme,tblnew)
ynew2 = 10×1

     2
     3
     5
     4
     2
     2
     2
     1
     2
     0

Больше о

развернуть все

Смотрите также

| | |