Размер выборки и степень теста
sampsizepwr
вычисляет размер выборки, степень или альтернативное значение параметров для теста гипотезы, учитывая два других значения. Для примера можно вычислить размер выборки, необходимый для получения определенной степени для теста гипотезы, учитывая значение параметров альтернативной гипотезы.
возвращает размер выборки, nout
= sampsizepwr(testtype
,p0
,p1
)nout
, необходимый для двустороннего испытания типа, заданного testtype
иметь степень (вероятность отклонения нулевой гипотезы, когда альтернативная гипотеза верна) 0,90, когда уровень значимости (вероятность отклонения нулевой гипотезы, когда нулевая гипотеза верна) равен 0,05. p0
задает значения параметров в гипотезе null. p1
задает значение или массив значений одиночного параметра, проверяемого под альтернативной гипотезой.
___ = sampsizepwr(
возвращает любой из предыдущих аргументов, используя один или несколько аргументы пары "имя-значение". Для примера можно изменить уровень значимости теста или задать тест с правым или левым хвостом. Пары "имя-значение" могут появиться в любом порядке, но должны начаться в шестой позиции аргумента.testtype
,p0
,p1
,pwr
,n
,Name,Value
)
Компания запускает производственный процесс, который заполняет пустые бутылки 100 мл жидкости. Чтобы контролировать качество, компания случайным образом выбирает несколько бутылок и измеряет объем жидкости внутри.
Определите размер выборки, которую компания должна использовать для t-теста, чтобы обнаружить различие между 100 мл и 102 мл с степенью 0,80. Предположим, что стандартное отклонение составляет 5 мл.
nout = sampsizepwr('t',[100 5],102,0.80)
nout = 52
Компания должна протестировать 52 бутылки, чтобы обнаружить различие между средним объемом 100 мл и 102 мл с степенью 0,80.
Сгенерируйте кривую степени, чтобы визуализировать, как размер выборки влияет на степень теста.
nn = 1:100; pwrout = sampsizepwr('t',[100 5],102,[],nn); figure; plot(nn,pwrout,'b-',nout,0.8,'ro') title('Power versus Sample Size') xlabel('Sample Size') ylabel('Power')
Сотрудница хочет купить дом возле своего офиса. Она решает исключить из фактора любой дом, который имеет среднее утреннее время поездки больше 20 минут. Нулевая гипотеза для этого правостороннего теста H0: = 20, и альтернативной гипотезой является HA: > 20. Выбранный уровень значимости 0,05.
Чтобы определить среднее время поездки, сотрудница проводит тест-драйв от дома до своего офиса в час пик каждое утро в течение одной недели, поэтому ее общий размер выборки составляет 5. Она принимает, что стандартное отклонение, , равно 5.
Сотрудник решает, что истинное среднее время поездки в 25 минут слишком отличается от ее целевых 20-минутных пределов, поэтому она хочет обнаружить значительный вылет, если истинное среднее значение составляет 25 минут. Найдите вероятность неправильного вывода о том, что среднее время коммутации не больше 20 минут.
Вычислите мощность теста, а затем вычитайте степень из 1, чтобы получить .
power = sampsizepwr('t',[20 5],25,[],5,'Tail','right'); beta = 1 - power
beta = 0.4203
значение указывает на вероятность 0,4203, что сотрудник неправильно делает вывод о том, что утренняя коммутация не превышает 20 минут.
Сотрудник решает, что этот риск слишком высок, и хочет не более 0,01 вероятности прийти к неправильному выводу. Рассчитать количество тестовых дисков, которые должен взять сотрудник, чтобы получить степень 0,99.
nout = sampsizepwr('t',[20 5],25,0.99,[],'Tail','right')
nout = 18
Результаты показывают, что она должна взять 18 тест-драйвов от дома-кандидата, чтобы достичь этого уровня степени.
Сотрудник решает, что у нее есть только время взять 10 тестовых накопителей. Она также принимает 0,05 вероятность сделать неправильный вывод. Вычислите наименьшее истинное значение параметров, которое создает обнаруживаемое различие за среднее время коммутации.
p1out = sampsizepwr('t',[20 5],[],0.95,10,'Tail','right')
p1out = 25.6532
Учитывая целевой уровень степени сотрудника и размер выборки, ее тест обнаруживает значительное различие от среднего времени коммутации не менее 25,6532 минут.
Вычислите размер выборки n, необходимый для различения p = 0,30 от p = 0,36, используя биномиальный тест со степенью 0,8.
napprox = sampsizepwr('p',0.30,0.36,0.8)
Warning: Values N>200 are approximate. Plotting the power as a function of N may reveal lower N values that have the required power.
napprox = 485
Результат указывает, что степень 0,8 требует размера выборки 485. Однако этот результат является приблизительным.
Постройте график, чтобы увидеть, обеспечивают ли любые меньшие n значений необходимую степень 0,8.
nn = 1:500;
pwrout = sampsizepwr('p',0.3,0.36,[],nn);
nexact = min(nn(pwrout>=0.8))
nexact = 462
figure plot(nn,pwrout,'b-',[napprox nexact],pwrout([napprox nexact]),'ro') grid on
Результат указывает, что размер выборки 462 также обеспечивает степень 0,8 для этого теста.
Фермер хочет проверить влияние двух разных видов удобрений на выражение своих бобовых культур. В настоящее время он использует удобрения A, но считает, что удобрения B могут улучшить выражение сельскохозяйственных культур. Поскольку удобрение B дороже, чем удобрение A, фермер хочет ограничить количество планов, которые он лечит с удобрением B в этом эксперименте.
Фермер использует соотношение объектов 2:1 в каждой группе лечения. Он тестирует 10 объекты с удобрением A и 5 объекты с удобрением B. Среднее выражение с использованием удобрения A составляет 1,4 кг на объект со стандартным отклонением 0,2. Среднее выражение с использованием удобрений B составляет 1,7 кг на объект. Уровень значимости теста составляет 0,05.
Вычислите степень теста.
pwr = sampsizepwr('t2',[1.4 0.2],1.7,[],5,'Ratio',2)
pwr = 0.7165
Фермер хочет увеличить степень теста до 0,90. Рассчитать, сколько объекты он должен обработать каждым видом удобрения.
n = sampsizepwr('t2',[1.4 0.2],1.7,0.9,[])
n = 11
Чтобы увеличить степень теста до 0,90, фермер должен протестировать 11 объекты с каждым видом удобрения.
Фермер хочет уменьшить количество объектов, которые он должен лечить удобрением B, но сохраните степень теста на уровне 0,90 и сохраните начальное соотношение объектов в каждой группе обработки
Используя соотношение 2:1 объектов в каждой группе обработки, вычислите, сколько объекты фермер должен протестировать, чтобы получить степень 0,90. Используйте среднее и стандартные значения отклонений, полученные в предыдущем тесте.
[n1out,n2out] = sampsizepwr('t2',[1.4,0.2],1.7,0.9,[],'Ratio',2)
n1out = 8
n2out = 16
Чтобы получить степень 0,90, фермер должен обработать 16 объекты удобрением А и 8 объекты удобрением В.
testtype
- Тип теста'z'
| 't'
| 't2'
| 'var'
| 'p'
Тип теста, заданный как один из следующих.
'z'
- z-тест для нормально распределенных данных с известным стандартным отклонением.
't'
- t-тест для нормально распределенных данных с неизвестным стандартным отклонением.
't2'
- объединенный t-тест с двумя выборками для нормально распределенных данных с неизвестным стандартным отклонением и равными отклонениями.
'var'
- Chi-квадратный тест отклонения для нормально распределенных данных.
'p'
- Тест параметра p (вероятность успеха) для биномиального распределения. The 'p'
тест является дискретным тестом, для которого увеличение размера выборки не всегда увеличивает степень. Для n
значения больше 200, могут существовать значения меньше, чем возвращенные n
значение, которое также вырабатывает заданную степень.
p0
- Значение параметров при нулевой гипотезеЗначение параметров под гипотезой null, заданное в виде скалярного значения или двухэлементного массива скалярных значений.
Если testtype
является 'z'
или 't'
, затем p0
является двухэлементным массивом [mu0,sigma0]
среднего и стандартного отклонений, соответственно, при нулевой гипотезе.
Если testtype
является 't2'
, затем p0
является двухэлементным массивом [mu0,sigma0]
среднего и стандартного отклонений, соответственно, первой выборки при нулевых и альтернативных гипотезах.
Если testtype
является 'var'
, затем p0
- отклонение при нулевой гипотезе.
Если testtype
является 'p'
, затем p0
- значение p при нулевой гипотезе.
Типы данных: single
| double
p1
- Значение параметров при альтернативной гипотезе[]
Значение параметров под альтернативной гипотезой, заданное как скалярное значение или как массив скалярных значений.
Если testtype
является 'z'
или 't'
, затем p1
- значение среднего значения при альтернативной гипотезе.
Если testtype
является 't2'
, затем p1
- значение среднего значения второй выборки при альтернативной гипотезе.
Если testtype
является 'var'
, затем p1
- отклонение под альтернативной гипотезой.
Если testtype
является 'p'
, затем p1
- значение p под альтернативной гипотезой.
Если вы задаете p1
как массив, тогда sampsizepwr
возвращает массив для nout
или pwrout
это та же длина, что и p1
.
Чтобы вернуть альтернативное значение параметров, p1out
, задайте p1
использование пустых скобок ([]
), как показано в описании синтаксиса.
Типы данных: single
| double
pwr
- Степень теста[]
Степень теста, заданная как скалярное значение в области значений (0,1) или как массив скалярных значений в области значений (0,1). Степень теста является вероятностью отклонения нулевой гипотезы, когда альтернативная гипотеза верна, учитывая особый уровень значимости.
Если вы задаете pwr
как массив, тогда sampsizepwr
возвращает массив для nout
или p1out
это та же длина, что и pwr
.
Чтобы вернуть значение степени, pwrout
, задайте pwr
использование пустых скобок ([]
), как показано в описании синтаксиса.
Типы данных: single
| double
n
- Размер выборкиРазмер выборки, заданный как положительное целое число или как массив положительных целых значений.
Если testtype
является 't2'
, затем sampsizepwr
принимает, что два размера выборки равны. Для неравных размеров выборки задайте n
как меньший из двух размеров выборки, и используйте 'Ratio'
аргумент пары "имя-значение" для указания отношения размера выборки. Для примера, если меньший размер выборки 5 и больший размер выборки 10, задайте n
как 5, и 'Ratio'
Пара "имя-значение" как 2.
Если вы задаете n
как массив, тогда sampsizepwr
возвращает массив для pwrout
или p1out
это та же длина, что и n
.
Типы данных: single
| double
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
'Alpha',0.01,'Tail','right'
задает правохвостый тест с уровнем значимости 0,01.'Alpha'
- Уровень значимостиЗначение значимости теста, заданное как разделенная разделенными запятой парами, состоящая из 'Alpha'
и скалярное значение в области значений (0,1).
Пример: 'Alpha',0.01
Типы данных: single
| double
'Ratio'
- Коэффициент размера выборкиОтношение размера выборки для двухвыборочного t -test, заданное как разделенная разделенными запятой парами, состоящая из 'Ratio'
и скалярное значение, больше или равное 1. Значение Ratio
равно n2/n1
, где n2
- больший размер выборки, и n1
- меньший размер выборки.
Чтобы вернуть степень, pwrout
, или альтернативное значение параметров, p1out
, задайте меньший из двух размеров выборки для n
, и использовать 'Ratio'
для указания коэффициента размера выборки.
Пример: 'Ratio',2
'Tail'
- Тип теста'both'
(по умолчанию) | 'right'
| 'left'
Тип теста, заданный как разделенная разделенными запятой парами, состоящая из 'Tail'
и одно из следующих:
'both'
- Двусторонний тест для альтернативы, не равной p0
'right'
- Односторонний тест для альтернативы, большей p0
'left'
- Односторонний тест для альтернативы меньше p0
Пример: 'Tail','right'
nout
- Размер выборкиРазмер выборки, возвращенный как положительное целое число или как массив положительных целочисленных значений.
Если testtype
является t2
и вы используете 'Ratio'
аргумент пары "имя-значение" для определения отношения двух неравных размеров выборки, затем nout
возвращает меньший из двух размеров выборки.
Кроме того, чтобы вернуть оба размера выборки, задайте этот аргумент следующим [n1out,n2out]
. В этом случае, sampsizepwr
возвращает меньший размер выборки следующим n1out
, и больший размер выборки как n2out
.
Если вы задаете pwr
или p1
как массив, тогда sampsizepwr
возвращает массив для nout
это та же длина, что и pwr
или p1
.
pwrout
- Степень p1out
- Значение параметров для альтернативной гипотезыЗначение параметров для альтернативной гипотезы, возвращаемое как скалярное значение или как массив скалярных значений.
При вычислении p1out
для 'p'
тест, если ни одна альтернатива не может быть отклонена для заданных нулевой гипотезы и уровня значимости, функция отображает предупреждающее сообщение и возвращает NaN
.
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
Вы щелкнули по ссылке, которая соответствует команде MATLAB:
Выполните эту команду, введя её в командном окне MATLAB.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.