Загрузите выборочные данные.
Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:
Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess
)
Время вычислений для каждого пакета, в часах (time
)
Температура пакета, в градусах Цельсия (temp
)
Категориальная переменная, указывающая на поставщика (A
B
, или C
) из химиката, используемого в пакете (supplier
)
Количество дефектов в пакете (defects
)
Данные также включают time_dev
и temp_dev
, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.
Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess
, time_dev
, temp_dev
, и supplier
как предикторы фиксированных эффектов. Включайте термин случайных эффектов для прерывания, сгруппированного factory
, составлять качественные различия, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects
имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты. Задайте фиктивную переменную, кодирующую как 'effects'
, таким образом, фиктивные переменные коэффициенты суммируют к 0.
Количество дефектов может быть смоделировано с помощью распределения Пуассона
Это соответствует обобщенной линейной модели смешанных эффектов
где
количество дефектов, наблюдаемых в пакете, произведенном фабрикой во время пакета .
среднее количество дефектов, соответствующих фабрике (где ) во время пакета (где ).
, , и измерения для каждой переменной, которые соответствуют фабрике во время пакета . Например, указывает ли пакет, произведенный фабрикой во время пакета используемый новый процесс.
и фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C
или B
, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой во время пакета .
прерывание случайных эффектов для каждой фабрики это составляет специфичное для фабрики изменение по качеству.
Вычислите и отобразите предполагаемые содействующие значения фиксированных эффектов и связанную статистику.
stats =
Fixed effect coefficients: DFMethod = 'residual', Alpha = 0.05
Name Estimate SE tStat DF pValue
{'(Intercept)'} 1.4689 0.15988 9.1875 94 9.8194e-15
{'newprocess' } -0.36766 0.17755 -2.0708 94 0.041122
{'time_dev' } -0.094521 0.82849 -0.11409 94 0.90941
{'temp_dev' } -0.28317 0.9617 -0.29444 94 0.76907
{'supplier_C' } -0.071868 0.078024 -0.9211 94 0.35936
{'supplier_B' } 0.071072 0.07739 0.91836 94 0.36078
Lower Upper
1.1515 1.7864
-0.72019 -0.015134
-1.7395 1.5505
-2.1926 1.6263
-0.22679 0.083051
-0.082588 0.22473
Возвращенные результаты показывают, например, что предполагаемый коэффициент для temp_dev
–0.28317. Его большое - значение, 0.76907, указывает, что это не статистически значительный предиктор на 5%-м уровне значения. Кроме того, контуры доверительного интервала Lower
и Upper
укажите что 95%-й доверительный интервал для коэффициента для temp_dev
[-2.1926, 1.6263]. Этот интервал содержит 0, который поддерживает заключение что temp_dev
не является статистически значительным на 5%-м уровне значения.