sampsizepwr

Размер выборки и степень теста

Описание

sampsizepwr вычисляет размер выборки, степень или альтернативное значение параметров для теста гипотезы, учитывая два других значения. Для примера можно вычислить размер выборки, необходимый для получения определенной степени для теста гипотезы, учитывая значение параметров альтернативной гипотезы.

nout = sampsizepwr(testtype,p0,p1) возвращает размер выборки, nout, необходимый для двустороннего испытания типа, заданного testtype иметь степень (вероятность отклонения нулевой гипотезы, когда альтернативная гипотеза верна) 0,90, когда уровень значимости (вероятность отклонения нулевой гипотезы, когда нулевая гипотеза верна) равен 0,05. p0 задает значения параметров в гипотезе null. p1 задает значение или массив значений одиночного параметра, проверяемого под альтернативной гипотезой.

пример

nout = sampsizepwr(testtype,p0,p1,pwr) возвращает размер выборки, nout, который соответствует заданной степени, pwrи значение параметров под альтернативной гипотезой, p1.

пример

pwrout = sampsizepwr(testtype,p0,p1,[],n) возвращает степень, достигнутое для размера выборки n когда true значения параметров p1.

пример

p1out = sampsizepwr(testtype,p0,[],pwr,n) возвращает значение параметров, обнаруживаемое с заданным размером выборки, n, и заданную степень, pwr.

пример

___ = sampsizepwr(testtype,p0,p1,pwr,n,Name,Value) возвращает любой из предыдущих аргументов, используя один или несколько аргументы пары "имя-значение". Для примера можно изменить уровень значимости теста или задать тест с правым или левым хвостом. Пары "имя-значение" могут появиться в любом порядке, но должны начаться в шестой позиции аргумента.

Примеры

свернуть все

Компания запускает производственный процесс, который заполняет пустые бутылки 100 мл жидкости. Чтобы контролировать качество, компания случайным образом выбирает несколько бутылок и измеряет объем жидкости внутри.

Определите размер выборки, которую компания должна использовать для t-теста, чтобы обнаружить различие между 100 мл и 102 мл с степенью 0,80. Предположим, что стандартное отклонение составляет 5 мл.

nout = sampsizepwr('t',[100 5],102,0.80)
nout = 52

Компания должна протестировать 52 бутылки, чтобы обнаружить различие между средним объемом 100 мл и 102 мл с степенью 0,80.

Сгенерируйте кривую степени, чтобы визуализировать, как размер выборки влияет на степень теста.

nn = 1:100;
pwrout = sampsizepwr('t',[100 5],102,[],nn);

figure;
plot(nn,pwrout,'b-',nout,0.8,'ro')
title('Power versus Sample Size')
xlabel('Sample Size')
ylabel('Power')

Figure contains an axes. The axes with title Power versus Sample Size contains 2 objects of type line.

Сотрудница хочет купить дом возле своего офиса. Она решает исключить из фактора любой дом, который имеет среднее утреннее время поездки больше 20 минут. Нулевая гипотеза для этого правостороннего теста H0: μ = 20, и альтернативной гипотезой является HA: μ > 20. Выбранный уровень значимости 0,05.

Чтобы определить среднее время поездки, сотрудница проводит тест-драйв от дома до своего офиса в час пик каждое утро в течение одной недели, поэтому ее общий размер выборки составляет 5. Она принимает, что стандартное отклонение, σ, равно 5.

Сотрудник решает, что истинное среднее время поездки в 25 минут слишком отличается от ее целевых 20-минутных пределов, поэтому она хочет обнаружить значительный вылет, если истинное среднее значение составляет 25 минут. Найдите вероятность неправильного вывода о том, что среднее время коммутации не больше 20 минут.

Вычислите мощность теста, а затем вычитайте степень из 1, чтобы получить β.

power = sampsizepwr('t',[20 5],25,[],5,'Tail','right');
beta = 1 - power
beta = 0.4203

β значение указывает на вероятность 0,4203, что сотрудник неправильно делает вывод о том, что утренняя коммутация не превышает 20 минут.

Сотрудник решает, что этот риск слишком высок, и хочет не более 0,01 вероятности прийти к неправильному выводу. Рассчитать количество тестовых дисков, которые должен взять сотрудник, чтобы получить степень 0,99.

nout = sampsizepwr('t',[20 5],25,0.99,[],'Tail','right')
nout = 18

Результаты показывают, что она должна взять 18 тест-драйвов от дома-кандидата, чтобы достичь этого уровня степени.

Сотрудник решает, что у нее есть только время взять 10 тестовых накопителей. Она также принимает 0,05 вероятность сделать неправильный вывод. Вычислите наименьшее истинное значение параметров, которое создает обнаруживаемое различие за среднее время коммутации.

p1out = sampsizepwr('t',[20 5],[],0.95,10,'Tail','right')
p1out = 25.6532

Учитывая целевой уровень степени сотрудника и размер выборки, ее тест обнаруживает значительное различие от среднего времени коммутации не менее 25,6532 минут.

Вычислите размер выборки n, необходимый для различения p = 0,30 от p = 0,36, используя биномиальный тест со степенью 0,8.

napprox = sampsizepwr('p',0.30,0.36,0.8)
Warning: Values N>200 are approximate.  Plotting the power as a function
of N may reveal lower N values that have the required power.
napprox = 485

Результат указывает, что степень 0,8 требует размера выборки 485. Однако этот результат является приблизительным.

Постройте график, чтобы увидеть, обеспечивают ли любые меньшие n значений необходимую степень 0,8.

nn = 1:500;
pwrout = sampsizepwr('p',0.3,0.36,[],nn);
nexact = min(nn(pwrout>=0.8))
nexact = 462
figure
plot(nn,pwrout,'b-',[napprox nexact],pwrout([napprox nexact]),'ro')
grid on

Figure contains an axes. The axes contains 2 objects of type line.

Результат указывает, что размер выборки 462 также обеспечивает степень 0,8 для этого теста.

Фермер хочет проверить влияние двух разных видов удобрений на выражение своих бобовых культур. В настоящее время он использует удобрения A, но считает, что удобрения B могут улучшить выражение сельскохозяйственных культур. Поскольку удобрение B дороже, чем удобрение A, фермер хочет ограничить количество планов, которые он лечит с удобрением B в этом эксперименте.

Фермер использует соотношение объектов 2:1 в каждой группе лечения. Он тестирует 10 объекты с удобрением A и 5 объекты с удобрением B. Среднее выражение с использованием удобрения A составляет 1,4 кг на объект со стандартным отклонением 0,2. Среднее выражение с использованием удобрений B составляет 1,7 кг на объект. Уровень значимости теста составляет 0,05.

Вычислите степень теста.

pwr = sampsizepwr('t2',[1.4 0.2],1.7,[],5,'Ratio',2)
pwr = 0.7165

Фермер хочет увеличить степень теста до 0,90. Рассчитать, сколько объекты он должен обработать каждым видом удобрения.

n = sampsizepwr('t2',[1.4 0.2],1.7,0.9,[])
n = 11

Чтобы увеличить степень теста до 0,90, фермер должен протестировать 11 объекты с каждым видом удобрения.

Фермер хочет уменьшить количество объектов, которые он должен лечить удобрением B, но сохраните степень теста на уровне 0,90 и сохраните начальное соотношение объектов в каждой группе обработки

Используя соотношение 2:1 объектов в каждой группе обработки, вычислите, сколько объекты фермер должен протестировать, чтобы получить степень 0,90. Используйте среднее и стандартные значения отклонений, полученные в предыдущем тесте.

[n1out,n2out] = sampsizepwr('t2',[1.4,0.2],1.7,0.9,[],'Ratio',2)
n1out = 8
n2out = 16

Чтобы получить степень 0,90, фермер должен обработать 16 объекты удобрением А и 8 объекты удобрением В.

Входные параметры

свернуть все

Тип теста, заданный как один из следующих.

  • 'z' - z-тест для нормально распределенных данных с известным стандартным отклонением.

  • 't' - t-тест для нормально распределенных данных с неизвестным стандартным отклонением.

  • 't2' - объединенный t-тест с двумя выборками для нормально распределенных данных с неизвестным стандартным отклонением и равными отклонениями.

  • 'var' - Chi-квадратный тест отклонения для нормально распределенных данных.

  • 'p' - Тест параметра p (вероятность успеха) для биномиального распределения. The 'p' тест является дискретным тестом, для которого увеличение размера выборки не всегда увеличивает степень. Для n значения больше 200, могут существовать значения меньше, чем возвращенные n значение, которое также вырабатывает заданную степень.

Значение параметров под гипотезой null, заданное в виде скалярного значения или двухэлементного массива скалярных значений.

  • Если testtype является 'z'или 't', затем p0 является двухэлементным массивом [mu0,sigma0] среднего и стандартного отклонений, соответственно, при нулевой гипотезе.

  • Если testtype является 't2', затем p0 является двухэлементным массивом [mu0,sigma0] среднего и стандартного отклонений, соответственно, первой выборки при нулевых и альтернативных гипотезах.

  • Если testtype является 'var', затем p0 - отклонение при нулевой гипотезе.

  • Если testtype является 'p', затем p0 - значение p при нулевой гипотезе.

Типы данных: single | double

Значение параметров под альтернативной гипотезой, заданное как скалярное значение или как массив скалярных значений.

  • Если testtype является 'z' или 't', затем p1 - значение среднего значения при альтернативной гипотезе.

  • Если testtype является 't2', затем p1 - значение среднего значения второй выборки при альтернативной гипотезе.

  • Если testtype является 'var', затем p1 - отклонение под альтернативной гипотезой.

  • Если testtype является 'p', затем p1 - значение p под альтернативной гипотезой.

Если вы задаете p1 как массив, тогда sampsizepwr возвращает массив для nout или pwrout это та же длина, что и p1.

Чтобы вернуть альтернативное значение параметров, p1out, задайте p1 использование пустых скобок ([]), как показано в описании синтаксиса.

Типы данных: single | double

Степень теста, заданная как скалярное значение в области значений (0,1) или как массив скалярных значений в области значений (0,1). Степень теста является вероятностью отклонения нулевой гипотезы, когда альтернативная гипотеза верна, учитывая особый уровень значимости.

Если вы задаете pwr как массив, тогда sampsizepwr возвращает массив для nout или p1out это та же длина, что и pwr.

Чтобы вернуть значение степени, pwrout, задайте pwr использование пустых скобок ([]), как показано в описании синтаксиса.

Типы данных: single | double

Размер выборки, заданный как положительное целое число или как массив положительных целых значений.

Если testtype является 't2', затем sampsizepwr принимает, что два размера выборки равны. Для неравных размеров выборки задайте n как меньший из двух размеров выборки, и используйте 'Ratio' аргумент пары "имя-значение" для указания отношения размера выборки. Для примера, если меньший размер выборки 5 и больший размер выборки 10, задайте n как 5, и 'Ratio' Пара "имя-значение" как 2.

Если вы задаете n как массив, тогда sampsizepwr возвращает массив для pwrout или p1out это та же длина, что и n.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Alpha',0.01,'Tail','right' задает правохвостый тест с уровнем значимости 0,01.

Значение значимости теста, заданное как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Отношение размера выборки для двухвыборочного t -test, заданное как разделенная разделенными запятой парами, состоящая из 'Ratio' и скалярное значение, больше или равное 1. Значение Ratio равно n2/n1, где n2 - больший размер выборки, и n1 - меньший размер выборки.

Чтобы вернуть степень, pwrout, или альтернативное значение параметров, p1out, задайте меньший из двух размеров выборки для n, и использовать 'Ratio' для указания коэффициента размера выборки.

Пример: 'Ratio',2

Тип теста, заданный как разделенная разделенными запятой парами, состоящая из 'Tail' и одно из следующих:

  • 'both' - Двусторонний тест для альтернативы, не равной p0

  • 'right' - Односторонний тест для альтернативы, большей p0

  • 'left' - Односторонний тест для альтернативы меньше p0

Пример: 'Tail','right'

Выходные аргументы

свернуть все

Размер выборки, возвращенный как положительное целое число или как массив положительных целочисленных значений.

Если testtype является t2и вы используете 'Ratio' аргумент пары "имя-значение" для определения отношения двух неравных размеров выборки, затем nout возвращает меньший из двух размеров выборки.

Кроме того, чтобы вернуть оба размера выборки, задайте этот аргумент следующим [n1out,n2out]. В этом случае, sampsizepwr возвращает меньший размер выборки следующим n1out, и больший размер выборки как n2out.

Если вы задаете pwr или p1 как массив, тогда sampsizepwr возвращает массив для nout это та же длина, что и pwr или p1.

Степень, достигнутая тестом, возвращенная как скалярное значение в области значений (0,1) или как массив скалярных значений в области значений (0,1).

Если вы задаете n или p1 как массив, тогда sampsizepwr возвращает массив для pwrout это та же длина, что и n или p1.

Значение параметров для альтернативной гипотезы, возвращаемое как скалярное значение или как массив скалярных значений.

При вычислении p1out для 'p' тест, если ни одна альтернатива не может быть отклонена для заданных нулевой гипотезы и уровня значимости, функция отображает предупреждающее сообщение и возвращает NaN.

См. также

| | | |

Введенный в R2006b