Загрузите образцы данных.
Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:
Флаг, указывающий, использовала ли партия новый процесс (newprocess)
Время обработки для каждой партии, в часах (time)
Температура партии, в градусах Цельсия (temp)
Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)
Количество дефектов в партии (defects)
Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.
Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.
Количество дефектов можно смоделировать с помощью распределения Пуассона
)
Это соответствует обобщенной линейной модели смешанных эффектов
β5supplier _ Bij + bi,
где
- количество дефектов, наблюдаемых в партии, произведенной заводом во время партии .
- среднее число дефектов, соответствующих заводу (где 20) во время партии j (.. ., 5).
, и являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии jНапример, указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.
и являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом во время партии .
startb2) - перехват случайных эффектов для каждой i, который учитывает специфичные для фабрики вариации качества.
Проверка наличия существенных различий между поставщиком C и поставщиком B.
Большое значение p указывает на отсутствие существенной разницы между поставщиком C и поставщиком B на уровне значимости 5%. Здесь, coefTest также возвращает F-статистику, числительные степени свободы и приближенные знаменательные степени свободы.
Проверка наличия существенных различий между поставщиком A и поставщиком B.
При указании 'DummyVarCoding' аргумент пары имя-значение как 'effects' при подгонке модели с использованием fitglme, то
где , и соответствуют поставщикам A, B и C соответственно. - эффект А минус средний эффект А, В и С. Для определения контрастной матрицы, соответствующей тесту между поставщиком А и поставщиком В,
2βB + βC.
Из выходных данных disp(glme)столбец 5 контрастной матрицы соответствует , а столбец 6 соответствует . Поэтому контрастная матрица для этого теста указана как H = [0,0,0,0,1,2].
Большое значение p указывает на отсутствие существенной разницы между поставщиком A и поставщиком B на уровне значимости 5%.