Загрузите выборочные данные.
Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:
Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess
)
Время вычислений для каждого пакета, в часах (time
)
Температура пакета, в градусах Цельсия (temp
)
Категориальная переменная, указывающая на поставщика (A
B
, или C
) из химиката, используемого в пакете (supplier
)
Количество дефектов в пакете (defects
)
Данные также включают time_dev
и temp_dev
, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.
Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess
, time_dev
, temp_dev
, и supplier
как предикторы фиксированных эффектов. Включайте термин случайных эффектов для прерывания, сгруппированного factory
, составлять качественные различия, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects
имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты. Задайте фиктивную переменную, кодирующую как 'effects'
, таким образом, фиктивные переменные коэффициенты суммируют к 0.
Количество дефектов может быть смоделировано с помощью распределения Пуассона
Это соответствует обобщенной линейной модели смешанных эффектов
где
количество дефектов, наблюдаемых в пакете, произведенном фабрикой во время пакета .
среднее количество дефектов, соответствующих фабрике (где ) во время пакета (где ).
, , и измерения для каждой переменной, которые соответствуют фабрике во время пакета . Например, указывает ли пакет, произведенный фабрикой во время пакета используемый новый процесс.
и фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C
или B
, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой во время пакета .
прерывание случайных эффектов для каждой фабрики это составляет специфичное для фабрики изменение по качеству.
glme =
Generalized linear mixed-effects model fit by ML
Model information:
Number of observations 100
Fixed effects coefficients 6
Random effects coefficients 20
Covariance parameters 1
Distribution Poisson
Link Log
FitMethod Laplace
Formula:
defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)
Model fit statistics:
AIC BIC LogLikelihood Deviance
416.35 434.58 -201.17 402.35
Fixed effects coefficients (95% CIs):
Name Estimate SE tStat DF pValue
{'(Intercept)'} 1.4689 0.15988 9.1875 94 9.8194e-15
{'newprocess' } -0.36766 0.17755 -2.0708 94 0.041122
{'time_dev' } -0.094521 0.82849 -0.11409 94 0.90941
{'temp_dev' } -0.28317 0.9617 -0.29444 94 0.76907
{'supplier_C' } -0.071868 0.078024 -0.9211 94 0.35936
{'supplier_B' } 0.071072 0.07739 0.91836 94 0.36078
Lower Upper
1.1515 1.7864
-0.72019 -0.015134
-1.7395 1.5505
-2.1926 1.6263
-0.22679 0.083051
-0.082588 0.22473
Random effects covariance parameters:
Group: factory (20 Levels)
Name1 Name2 Type Estimate
{'(Intercept)'} {'(Intercept)'} {'std'} 0.31381
Group: Error
Name Estimate
{'sqrt(Dispersion)'} 1
Выполните - протестируйте, чтобы определить, равны ли все коэффициенты фиксированных эффектов 0.
stats =
ANOVA marginal tests: DFMethod = 'residual'
Term FStat DF1 DF2 pValue
{'(Intercept)'} 84.41 1 94 9.8194e-15
{'newprocess' } 4.2881 1 94 0.041122
{'time_dev' } 0.013016 1 94 0.90941
{'temp_dev' } 0.086696 1 94 0.76907
{'supplier' } 0.59212 2 94 0.5552
- значения для прерывания, newprocess
, time_dev
, и temp_dev
эквивалентны в содействующей таблице glme
отображение. Маленькое - значения для прерывания и newprocess
укажите, что это значительные предикторы на 5%-м уровне значения. Большое - значения для time_dev
и temp_dev
укажите, что это не значительные предикторы на этом уровне.
- значение 0,5552 для supplier
измеряет объединенное значение для обоих коэффициентов, представляющих категориальную переменную supplier
. Это включает фиктивные переменные supplier_C
и supplier_B
как показано в содействующей таблице glme
отображение. Большое - значение указывает на тот supplier
не значительный предиктор на 5%-м уровне значения.