sampsizepwr

Объем выборки и степень теста

Описание

sampsizepwr вычисляет объем выборки, степень или альтернативное значение параметров для теста гипотезы, учитывая другие два значения. Например, можно вычислить объем выборки, требуемый получить конкретную степень для теста гипотезы, учитывая значение параметров альтернативной гипотезы.

nout = sampsizepwr(testtype,p0,p1) возвращает объем выборки, nout, требуемый для двухстороннего теста типа задан testtype чтобы иметь силу (вероятность отклонения нулевой гипотезы, когда альтернативная гипотеза верна) 0,90 когда, уровень значения (вероятность отклонения нулевой гипотезы, когда нулевая гипотеза верна) 0.05. p0 задает значения параметров по нулевой гипотезе. p1 задает значение или массив значений, одного параметра, протестированного в соответствии с альтернативной гипотезой.

пример

nout = sampsizepwr(testtype,p0,p1,pwr) возвращает объем выборки, nout, это соответствует заданной степени, pwr, и значение параметров в соответствии с альтернативной гипотезой, p1.

пример

pwrout = sampsizepwr(testtype,p0,p1,[],n) возвращает степень, достигнутую для объема выборки n когда истинным значением параметров является p1.

пример

p1out = sampsizepwr(testtype,p0,[],pwr,n) возвращает значение параметров, обнаруживаемое с заданным объемом выборки, n, и заданная степень, pwr.

пример

___ = sampsizepwr(testtype,p0,p1,pwr,n,Name,Value) возвращает любой из предыдущих аргументов с помощью одного или нескольких аргументов пары "имя-значение". Например, можно изменить уровень значения теста или задать право - или лево-хвостатый тест. Пары "имя-значение" могут появиться в любом порядке, но должны начаться в шестом положении аргумента.

Примеры

свернуть все

Компания запускает производственный процесс, который заполняет пустые бутылки 100 мл жидкости. К качеству монитора компания случайным образом выбирает несколько бутылок и измеряет объем жидкости внутри.

Определите объем выборки, который компания должна использовать для t-теста, чтобы обнаружить различие между 100 мл и 102 мл со степенью 0,80. Примите, что стандартное отклонение составляет 5 мл.

nout = sampsizepwr('t',[100 5],102,0.80)
nout = 52

Компания должна протестировать 52 бутылки, чтобы обнаружить различие между средним объемом 100 мл и 102 мл со степенью 0,80.

Сгенерируйте кривую степени, чтобы визуализировать, как объем выборки влияет на степень теста.

nn = 1:100;
pwrout = sampsizepwr('t',[100 5],102,[],nn);

figure;
plot(nn,pwrout,'b-',nout,0.8,'ro')
title('Power versus Sample Size')
xlabel('Sample Size')
ylabel('Power')

Figure contains an axes object. The axes object with title Power versus Sample Size contains 2 objects of type line.

Сотрудница хочет купить дом около своего офиса. Она решает устранить из фактора любой дом, который имеет среднее утреннее время поездки на работу, больше, чем 20 минут. Нулевая гипотеза для этого правостороннего теста является H0: μ = 20, и альтернативная гипотеза HA: μ > 20. Выбранный уровень значения 0.05.

Чтобы определить среднее время поездки на работу, сотрудница берет тест-драйв от дома до ее офиса в течение часа пик каждое утро в течение одной недели, таким образом, ее общий объем выборки равняется 5. Она принимает что стандартное отклонение, σ, равно 5.

Сотрудница решает, что истинное среднее время поездки на работу 25 минут слишком отличается от ее целенаправленного 20-минутного предела, таким образом, она хочет обнаружить значительный отъезд, если истинное среднее значение составляет 25 минут. Найдите вероятность неправильного заключения, что среднее время поездки на работу не больше, чем 20 минут.

Вычислите степень теста, и затем вычтите степень от 1, чтобы получить β.

power = sampsizepwr('t',[20 5],25,[],5,'Tail','right');
beta = 1 - power
beta = 0.4203

β значение указывает на вероятность 0,4203, что сотрудник приходит к заключению неправильно, что утренняя поездка на работу не больше 20 минут.

Сотрудница решает, что этот риск слишком высок, и она хочет не больше, чем 0,01 вероятности того, чтобы сделать неправильный вывод. Вычислите количество тест-драйвов, которые сотрудник должен взять, чтобы получить степень 0,99.

nout = sampsizepwr('t',[20 5],25,0.99,[],'Tail','right')
nout = 18

Результаты показывают, что она должна взять 18 тест-драйвов из дома кандидата, чтобы достигнуть этого уровня мощности.

Сотрудница решает, что у нее только есть время, чтобы взять 10 тест-драйвов. Она также принимает 0,05 вероятности создания неправильного заключения. Вычислите самое маленькое истинное значение параметров, которое производит обнаруживаемое различие в среднее время поездки на работу.

p1out = sampsizepwr('t',[20 5],[],0.95,10,'Tail','right')
p1out = 25.6532

Учитывая целевой уровень мощности сотрудника и объем выборки, ее тест обнаруживает значительную разницу со среднего времени поездки на работу по крайней мере 25,6532 минут.

Вычислите объем выборки, n, требуемый отличить p = 0.30 от p = 0.36, с помощью биномиального теста со степенью 0,8.

napprox = sampsizepwr('p',0.30,0.36,0.8)
Warning: Values N>200 are approximate.  Plotting the power as a function
of N may reveal lower N values that have the required power.
napprox = 485

Результат показывает, что степень 0,8 требует объема выборки 485. Однако этот результат является аппроксимированным.

Сделайте график видеть, обеспечивают ли какие-либо меньшие n значения необходимую степень 0,8.

nn = 1:500;
pwrout = sampsizepwr('p',0.3,0.36,[],nn);
nexact = min(nn(pwrout>=0.8))
nexact = 462
figure
plot(nn,pwrout,'b-',[napprox nexact],pwrout([napprox nexact]),'ro')
grid on

Figure contains an axes object. The axes object contains 2 objects of type line.

Результат показывает, что объем выборки 462 также обеспечивает степень 0,8 для этого теста.

Фермер хочет протестировать удар двух различных типов удобрения на выражении его бобовых обрезок. Он в настоящее время использует Fertilizer A, но полагает, что Fertilizer B может улучшить урожайность. Поскольку Fertilizer B является более дорогим, чем Фертилизер А, фермер хочет ограничить количество планов, он относится с Fertilizer B в этом эксперименте.

Фермер использует 2:1 отношение объектов в каждой контрольной группе. Он тестирует 10 объектов с Удобрением A и 5 объектов с Удобрением B. Среднее выражение с помощью Удобрения A составляет 1,4 кг на объект со стандартным отклонением 0,2. Среднее выражение с помощью Удобрения B составляет 1,7 кг на объект. Уровень значения теста 0.05.

Вычислите степень теста.

pwr = sampsizepwr('t2',[1.4 0.2],1.7,[],5,'Ratio',2)
pwr = 0.7165

Фермер хочет увеличить степень теста к 0,90. Вычислите, сколько объектов он должен отнестись с каждым типом удобрения.

n = sampsizepwr('t2',[1.4 0.2],1.7,0.9,[])
n = 11

Чтобы увеличить степень теста к 0,90, фермер должен протестировать 11 объектов с каждым типом удобрения.

Фермер хочет сократить количество объектов, он должен отнестись с Удобрением B, но сохранить степень теста в 0,90 и обеспечить начальную букву 2:1 отношение объектов в каждой контрольной группе

Используя 2:1 отношение объектов в каждой контрольной группе, вычислите, сколько объектов фермер должен протестировать, чтобы получить степень 0,90. Используйте значения среднего и стандартного отклонения, полученные в предыдущем тесте.

[n1out,n2out] = sampsizepwr('t2',[1.4,0.2],1.7,0.9,[],'Ratio',2)
n1out = 8
n2out = 16

Чтобы получить степень 0,90, фермер должен обработать 16 объектов с Удобрением A и 8 объектов с Удобрением B.

Входные параметры

свернуть все

Протестируйте тип в виде одного из следующих.

  • 'z'z-тест для нормально распределенных данных с известным стандартным отклонением.

  • 't't-тест для нормально распределенных данных с неизвестным стандартным отклонением.

  • 't2' — 2D выборка объединила t-тест для нормально распределенных данных с неизвестным стандартным отклонением и равными отклонениями.

  • 'var' — Тест хи-квадрата отклонения для нормально распределенных данных.

  • 'p' — Тест p параметра (вероятность успеха) для биномиального распределения. 'p' тест является дискретным тестом, для которого увеличение объема выборки не всегда увеличивает степень. Для n значения, больше, чем 200, там может существовать значения, меньшие, чем возвращенный n значение, которые также производят заданную энергию.

Значение параметров по нулевой гипотезе в виде скалярного значения или двухэлементного массива скалярных значений.

  • Если testtype 'z'или 't', затем p0 двухэлементный массив [mu0,sigma0] из среднего и стандартного отклонения, соответственно, по нулевой гипотезе.

  • Если testtype 't2', затем p0 двухэлементный массив [mu0,sigma0] из среднего и стандартного отклонения, соответственно, первой выборки в соответствии с пустыми и альтернативными гипотезами.

  • Если testtype 'var', затем p0 отклонение по нулевой гипотезе.

  • Если testtype 'p', затем p0 значение p по нулевой гипотезе.

Типы данных: single | double

Значение параметров в соответствии с альтернативной гипотезой в виде скалярного значения или как массив скалярных значений.

  • Если testtype 'z' или 't', затем p1 значение среднего значения в соответствии с альтернативной гипотезой.

  • Если testtype 't2', затем p1 значение среднего значения второй выборки в соответствии с альтернативной гипотезой.

  • Если testtype 'var', затем p1 отклонение в соответствии с альтернативной гипотезой.

  • Если testtype 'p', затем p1 значение p в соответствии с альтернативной гипотезой.

Если вы задаете p1 как массив, затем sampsizepwr возвращает массив для nout или pwrout это - та же длина как p1.

Возвратить альтернативное значение параметров, p1out, задайте p1 использование пустых скобок ([]), как показано в описании синтаксиса.

Типы данных: single | double

Степень теста в виде скалярного значения в области значений (0,1) или как массив скалярных значений в области значений (0,1). Степень теста является вероятностью отклонения нулевой гипотезы, когда альтернативная гипотеза верна, учитывая конкретный уровень значения.

Если вы задаете pwr как массив, затем sampsizepwr возвращает массив для nout или p1out это - та же длина как pwr.

Возвращать значение степени, pwrout, задайте pwr использование пустых скобок ([]), как показано в описании синтаксиса.

Типы данных: single | double

Объем выборки в виде положительного целочисленного значения или как массив положительных целочисленных значений.

Если testtype 't2'то sampsizepwr принимает, что эти два объема выборки равны. Для неравных объемов выборки задайте n как меньшие из этих двух объемов выборки и использование 'Ratio' аргумент пары "имя-значение", чтобы указать на отношение объема выборки. Например, если меньший объем выборки равняется 5, и больший объем выборки равняется 10, задайте n как 5, и 'Ratio' пара "имя-значение" как 2.

Если вы задаете n как массив, затем sampsizepwr возвращает массив для pwrout или p1out это - та же длина как n.

Типы данных: single | double

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Alpha',0.01,'Tail','right' задает тест с правильным хвостом с 0,01 уровнями значения.

Значение значения теста в виде разделенной запятой пары, состоящей из 'Alpha' и скалярное значение в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Отношение объема выборки для 2D демонстрационного t - тестирует в виде разделенной запятой пары, состоящей из 'Ratio' и скалярное значение, больше, чем или равный 1. Значение Ratio равно n2/n1, где n2 больший объем выборки и n1 меньший объем выборки.

Возвратить степень, pwrout, или альтернативное значение параметров, p1out, задайте меньшие из этих двух объемов выборки для n, и используйте 'Ratio' указать на отношение объема выборки.

Пример: 'Ratio',2

Протестируйте тип в виде разделенной запятой пары, состоящей из 'Tail' и одно из следующего:

  • 'both' — Двухсторонний тест для альтернативы не равняется p0

  • 'right' — Односторонний тест для альтернативы, больше, чем p0

  • 'left' — Односторонний тест для альтернативы, меньшей, чем p0

Пример: 'Tail','right'

Выходные аргументы

свернуть все

Объем выборки, возвращенный как положительное целочисленное значение или как массив положительных целочисленных значений. sampsizepwr применяется ceil окружить необработанные объемы выборки до следующего целого числа.

Если testtype t2, и вы используете 'Ratio' аргумент пары "имя-значение", чтобы задать отношение двух неравных объемов выборки, затем nout возвращает меньшие из этих двух объемов выборки.

В качестве альтернативы, чтобы возвратить оба объема выборки, задайте этот аргумент как [n1out,n2out]. В этом случае, sampsizepwr возвращает меньший объем выборки как n1out, и больший объем выборки как n2out.

Если вы задаете pwr или p1 как массив, затем sampsizepwr возвращает массив для nout это - та же длина как pwr или p1.

Степень достигается тестом, возвращенным как скалярное значение в области значений (0,1) или как массив скалярных значений в области значений (0,1).

Если вы задаете n или p1 как массив, затем sampsizepwr возвращает массив для pwrout это - та же длина как n или p1.

Значение параметров для альтернативной гипотезы, возвращенной как скалярное значение или как массив скалярных значений.

При вычислении p1out для 'p' протестируйте, если никакая альтернатива не может быть отклонена для данной нулевой гипотезы и уровня значения, функция отображает предупреждающее сообщение и возвращает NaN.

Смотрите также

| | | |

Представленный в R2006b