exponenta event banner

sampsizepwr

Размер выборки и мощность теста

Описание

sampsizepwr вычисляет размер выборки, мощность или альтернативное значение параметра для теста гипотезы, учитывая два других значения. Например, можно вычислить размер выборки, необходимый для получения определенной мощности для теста гипотезы, учитывая значение параметра альтернативной гипотезы.

nout = sampsizepwr(testtype,p0,p1) возвращает размер выборки, nout, требуется для двустороннего испытания типа, указанного в testtype иметь степень (вероятность отклонения нулевой гипотезы, когда альтернативная гипотеза верна) 0,90, когда уровень значимости (вероятность отклонения нулевой гипотезы, когда нулевая гипотеза истинна) равен 0,05. p0 задает значения параметров при нулевой гипотезе. p1 задает значение или массив значений одного параметра, проверяемого в соответствии с альтернативной гипотезой.

пример

nout = sampsizepwr(testtype,p0,p1,pwr) возвращает размер выборки, nout, что соответствует заданной мощности, pwrи значение параметра в альтернативной гипотезе, p1.

пример

pwrout = sampsizepwr(testtype,p0,p1,[],n) возвращает мощность, достигаемую для размера выборки n когда истинным значением параметра является p1.

пример

p1out = sampsizepwr(testtype,p0,[],pwr,n) возвращает значение параметра, обнаруживаемое с указанным размером выборки, nи заданную мощность, pwr.

пример

___ = sampsizepwr(testtype,p0,p1,pwr,n,Name,Value) возвращает любой из предыдущих аргументов, использующих один или несколько аргументов пары имя-значение. Например, можно изменить уровень значимости теста или указать правый или левый тест. Пары имя-значение могут отображаться в любом порядке, но должны начинаться в шестой позиции аргумента.

Примеры

свернуть все

Компания осуществляет производственный процесс, который заполняет пустые бутылки 100 мл жидкости. Для контроля качества компания случайным образом выбирает несколько бутылок и измеряет объем жидкости внутри.

Определите размер выборки, которую компания должна использовать для t-теста, чтобы обнаружить разницу между 100 мл и 102 мл при мощности 0,80. Предположим, что стандартное отклонение составляет 5 мл.

nout = sampsizepwr('t',[100 5],102,0.80)
nout = 52

Компания должна протестировать 52 бутылки, чтобы обнаружить разницу между средним объемом 100 мл и 102 мл при мощности 0,80.

Создайте кривую мощности для визуализации влияния размера выборки на мощность теста.

nn = 1:100;
pwrout = sampsizepwr('t',[100 5],102,[],nn);

figure;
plot(nn,pwrout,'b-',nout,0.8,'ro')
title('Power versus Sample Size')
xlabel('Sample Size')
ylabel('Power')

Figure contains an axes. The axes with title Power versus Sample Size contains 2 objects of type line.

Сотрудница хочет купить дом возле своего офиса. Она решает исключить из рассмотрения любой дом, который имеет среднее время утренней поездки больше 20 минут. Нулевая гипотеза для этого правостороннего теста равна H0: λ = 20, а альтернативная гипотеза - HA: λ > 20. Выбранный уровень значимости составляет 0,05.

Чтобы определить среднее время поездки, сотрудница берет тест-драйв из дома в свой офис в час пик каждое утро в течение одной недели, поэтому ее общий размер выборки составляет 5. Она предполагает, что стандартное отклонение, λ, равно 5.

Сотрудник решает, что истинное среднее время поездки в 25 минут слишком отличается от ее целевого 20-минутного предела, поэтому она хочет обнаружить значительный выезд, если истинное среднее значение составляет 25 минут. Определите вероятность ошибочного вывода о том, что среднее время поездки не превышает 20 минут.

Вычислите мощность теста, а затем вычтите мощность из 1, чтобы получить β.

power = sampsizepwr('t',[20 5],25,[],5,'Tail','right');
beta = 1 - power
beta = 0.4203

Значение β указывает на вероятность 0,4203, что сотрудник неправильно делает вывод о том, что утреннее сообщение не превышает 20 минут.

Сотрудница решает, что этот риск слишком высок, и ей хочется не более 0,01 вероятности прийти к неверному выводу. Рассчитайте количество тест-драйвов, которые сотрудник должен взять для получения мощности 0,99.

nout = sampsizepwr('t',[20 5],25,0.99,[],'Tail','right')
nout = 18

Результаты показывают, что она должна взять 18 тест-драйвов от дома-кандидата, чтобы достичь этого уровня мощности.

Сотрудница решает, что успевает взять только 10 тест-драйвов. Она также принимает вероятность сделать неверный вывод 0,05. Вычислите наименьшее истинное значение параметра, которое создает обнаруживаемую разницу в среднем времени коммутации.

p1out = sampsizepwr('t',[20 5],[],0.95,10,'Tail','right')
p1out = 25.6532

Учитывая целевой уровень мощности сотрудника и размер выборки, ее тест обнаруживает значительное отличие от среднего времени поездки не менее 25,6532 минут.

Вычислите размер выборки n, необходимый для отличия p = 0,30 от p = 0,36, используя биномиальный тест с мощностью 0,8.

napprox = sampsizepwr('p',0.30,0.36,0.8)
Warning: Values N>200 are approximate.  Plotting the power as a function
of N may reveal lower N values that have the required power.
napprox = 485

Результат показывает, что мощность 0,8 требует размера выборки 485. Однако этот результат приблизителен.

Сделайте график, чтобы увидеть, обеспечивают ли меньшие значения n требуемую мощность 0,8.

nn = 1:500;
pwrout = sampsizepwr('p',0.3,0.36,[],nn);
nexact = min(nn(pwrout>=0.8))
nexact = 462
figure
plot(nn,pwrout,'b-',[napprox nexact],pwrout([napprox nexact]),'ro')
grid on

Figure contains an axes. The axes contains 2 objects of type line.

Результат показывает, что размер выборки 462 также обеспечивает мощность 0,8 для этого теста.

Фермер хочет проверить влияние двух различных видов удобрений на урожайность его бобовых культур. В настоящее время он использует удобрение А, но считает, что удобрение В может повысить урожайность. Поскольку удобрение B дороже удобрения A, фермер хочет ограничить количество планов, которые он лечит удобрением B в этом эксперименте.

Фермер использует соотношение растений 2:1 в каждой группе обработки. Он тестирует 10 растений с удобрением А, и 5 растений с удобрением В. Средний выход при использовании удобрения А составляет 1,4 кг на растение, со стандартным отклонением 0,2. Средний выход с использованием удобрения В составляет 1,7 кг на растение. Уровень значимости теста составляет 0,05.

Вычислите мощность теста.

pwr = sampsizepwr('t2',[1.4 0.2],1.7,[],5,'Ratio',2)
pwr = 0.7165

Фермер хочет увеличить мощность теста до 0,90. Подсчитайте, сколько растений он должен обработать с каждым типом удобрения.

n = sampsizepwr('t2',[1.4 0.2],1.7,0.9,[])
n = 11

Чтобы увеличить мощность теста до 0,90, фермер должен протестировать 11 растений с каждым типом удобрения.

Фермер хочет уменьшить количество растений, которые он должен обработать удобрением B, но сохранить мощность теста на уровне 0,90 и сохранить исходное соотношение 2:1 растений в каждой группе обработки

Используя соотношение 2:1 растений в каждой группе обработки, рассчитайте, сколько растений фермер должен протестировать, чтобы получить мощность 0,90. Используйте значения среднего и стандартного отклонения, полученные в предыдущем испытании.

[n1out,n2out] = sampsizepwr('t2',[1.4,0.2],1.7,0.9,[],'Ratio',2)
n1out = 8
n2out = 16

Для получения мощности 0,90 фермер должен обработать 16 растений удобрением А и 8 растений удобрением В.

Входные аргументы

свернуть все

Тип теста, указанный как один из следующих.

  • 'z' - z-тест для нормально распределенных данных с известным стандартным отклонением.

  • 't' - t-тест для нормально распределенных данных с неизвестным стандартным отклонением.

  • 't2' - объединенный t-тест с двумя выборками для нормально распределенных данных с неизвестным стандартным отклонением и равными отклонениями.

  • 'var' - тест дисперсии хи-квадрат для нормально распределенных данных.

  • 'p' - Проверка параметра p (вероятность успеха) для биномиального распределения. 'p' тест является дискретным тестом, для которого увеличение размера выборки не всегда увеличивает мощность. Для n значения больше 200, могут существовать значения меньше возвращенного n значение, которое также обеспечивает заданную мощность.

Значение параметра при нулевой гипотезе, определяемое как скалярное значение или двухэлементный массив скалярных значений.

  • Если testtype является 'z'или 't', то p0 является двухэлементным массивом [mu0,sigma0] среднего и стандартного отклонения, соответственно, при нулевой гипотезе.

  • Если testtype является 't2', то p0 является двухэлементным массивом [mu0,sigma0] среднего и стандартного отклонения, соответственно, первой выборки при нулевой и альтернативной гипотезах.

  • Если testtype является 'var', то p0 - дисперсия при нулевой гипотезе.

  • Если testtype является 'p', то p0 является значением p при нулевой гипотезе.

Типы данных: single | double

Значение параметра при альтернативной гипотезе, определяемое как скалярное значение или как массив скалярных значений.

  • Если testtype является 'z' или 't', то p1 - значение среднего значения при альтернативной гипотезе.

  • Если testtype является 't2', то p1 - значение среднего значения второй выборки при альтернативной гипотезе.

  • Если testtype является 'var', то p1 является дисперсией при альтернативной гипотезе.

  • Если testtype является 'p', то p1 является значением p при альтернативной гипотезе.

При указании p1 как массив, то sampsizepwr возвращает массив для nout или pwrout это та же длина, что и p1.

Чтобы вернуть альтернативное значение параметра, p1out, указать p1 с помощью пустых скобок ([]), как показано в описании синтаксиса.

Типы данных: single | double

Мощность теста, заданная как скалярное значение в диапазоне (0,1) или как массив скалярных значений в диапазоне (0,1). Мощность теста - вероятность отклонения нулевой гипотезы, когда альтернативная гипотеза верна, учитывая конкретный уровень значимости.

При указании pwr как массив, то sampsizepwr возвращает массив для nout или p1out это та же длина, что и pwr.

Чтобы вернуть значение мощности, pwrout, указать pwr с помощью пустых скобок ([]), как показано в описании синтаксиса.

Типы данных: single | double

Размер выборки, заданный как положительное целое значение или как массив положительных целых значений.

Если testtype является 't2', то sampsizepwr предполагает, что два размера выборки равны. Для неравных размеров выборки укажите n в качестве меньшего из двух размеров выборки и используйте 'Ratio' аргумент пары «имя-значение» для указания коэффициента размера выборки. Например, если меньший размер выборки равен 5, а больший размер выборки равен 10, укажите n как 5, и 'Ratio' пара имя-значение как 2.

При указании n как массив, то sampsizepwr возвращает массив для pwrout или p1out это та же длина, что и n.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Alpha',0.01,'Tail','right' задает правохвостый тест с уровнем значимости 0,01.

Значение значимости теста, указанное как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Коэффициент размера выборки для t-теста с двумя выборками, указанный как пара, разделенная запятыми, состоящая из 'Ratio' и скалярное значение, большее или равное 1. Значение Ratio равно n2/n1, где n2 - больший размер выборки, и n1 - меньший размер выборки.

Чтобы вернуть мощность, pwroutили альтернативное значение параметра, p1out, укажите меньший из двух размеров выборки для nи использовать 'Ratio' для указания коэффициента размера выборки.

Пример: 'Ratio',2

Тип теста, указанный как разделенная запятыми пара, состоящая из 'Tail' и одно из следующих:

  • 'both' - Двустороннее испытание для альтернативы, не равной p0

  • 'right' - Одностороннее испытание для альтернативы, превышающей p0

  • 'left' - Одностороннее испытание для альтернативы, меньшей, чем p0

Пример: 'Tail','right'

Выходные аргументы

свернуть все

Размер выборки, возвращаемый как положительное целое значение или как массив положительных целых значений.

Если testtype является t2, и вы используете 'Ratio' аргумент пары имя-значение для указания отношения двух неравных размеров выборки, затем nout возвращает меньший из двух размеров выборки.

Кроме того, чтобы вернуть оба размера выборки, укажите этот аргумент как [n1out,n2out]. В этом случае sampsizepwr возвращает меньший размер выборки как n1outи больший размер выборки как n2out.

При указании pwr или p1 как массив, то sampsizepwr возвращает массив для nout это та же длина, что и pwr или p1.

Мощность, достигаемая тестом, возвращается как скалярное значение в диапазоне (0,1) или как массив скалярных значений в диапазоне (0,1).

При указании n или p1 как массив, то sampsizepwr возвращает массив для pwrout это та же длина, что и n или p1.

Значение параметра для альтернативной гипотезы, возвращаемое как скалярное значение или как массив скалярных значений.

При вычислениях p1out для 'p' тест, если невозможно отклонить альтернативу для данной нулевой гипотезы и уровня значимости, функция отображает предупреждающее сообщение и возвращает NaN.

См. также

| | | |

Представлен в R2006b