Статистика — это наука об измерениях различных данных и их анализе. Как и в других дисциплинах, в статистике есть понятие гипотезы. В данном случае, гипотеза – это какое-либо состояние, которое нужно принять или исключить. В данном направлении существуют несколько похожих между собой допущений, но имеющих некоторое отличие.
Статистическая гипотеза — это изучение генеральной совокупности (множество возможных результатов исследований) основных для науки объектов, относительно которых делаются выводы.
Содержание статьи:
Как проверить гипотезу
Проверить ее возможно посредством выборки. Например, рассмотрим несколько статистических гипотез:
- — от степени образования каждого ученика, возможно зависит успеваемость класса в целом;
- — начальный курс математики одинаково усваивается как детьми, которые начали обучение в шестилетнем возрасте, так и детьми, начавшими обучение с 7 лет.
Предположение, характеризующее конкретные границы величины, взятые учеными, называется простой гипотезой. Из множества простых гипотез складывается сложная гипотеза, указывается какое-либо направление либо четкого ответа нет.
Подробности
Пример
Для понимания понятия нулевая гипотеза, рассмотрим пример. Профессор в институте предположил, что разная степень подготовки студентов двух групп к зачетной сессии вызвана некоторыми причинами, которые не влияют на общую степень образования (разница в степени подготовки двух групп учащихся равна нулю). В науке не существует понятия «не различаются», есть понятие- «сходство равно нулю».
Таким образом, нулевая гипотеза – это теория, утверждающая, что между сравнимыми характеристиками отсутствуют различия, а видимые колебания можно объяснить случайными отклонениями в выборках, которые лежат в основе проводимых сравнений. Иными словами, имеются две совокупности, сходство которых равно нулю.
Рассмотрим другой пример альтернативной теории – профессор в институте предположил, что разная степень подготовленности студентов двух групп к зачетной сессии обусловлена применением двух различных по сути методов обучения (подготовленность двух групп существенно отличается и на это есть разъяснение).
Из этих примеров видно, чем отличаются две гипотезы (нулевая и альтернативная) друг от друга
При использовании способа альтернативной гипотезы, которая утверждает обратное понятие по отношению к нулевой, можно путем сравнения из двух вариантов выбрать правильный. Это принцип статистики.
Если нулевая гипотеза в науке – НО, а альтернативная — Н1, отсюда следует формула:
НО: с=с0;
Н1:с=/=с0.
где, с — некоторая средняя величина генеральной совокупности, которую нужно найти, а с0 — это изначальная величина, по отношению к которой исследуется гипотеза. Так же имеется число Х — средняя величина выборки, по которой определяется с0.
Исследование заключается в сравнении величин Х и с0, в случае если они равны – принимается нулевая гипотеза, если неравны, то правильной является альтернативная гипотеза.
Проверка нулевой гипотезы в статистике состоит в применении статистического критерия, который подчиняется разным законам распределения. Статистические критерии используются для опровержения правильности нулевой гипотезы, а не для ее доказательства.
Например, есть F — критерий, рассчитываемый по распределению Фишера, Т – критерий, который рассчитывается по распределению Стьюдента и т.д. Возьмем отрезок либо точку на оси Х (область допустимых значений), на которой имеется много величин статистики (при этих значениях нулевая гипотеза верна). Критическими значениями будем считать крайние точки отрезка, а соответственно, лучи расположенные в стороны отрезка (левую и правую) называются критическими областями. В случае, если вычисленное значение входит в них, то нулевая гипотеза опровергается, а альтернативная будет верной.
В процессе проверки нулевой теории возможны ошибки двух видов:
- Опровержение верной нулевой гипотезы (а=1).
- Принятие ложной нулевой теории (а=2).
Надо сказать, что это различные параметры, результаты ошибок могут иметь различные выборки и отличаться между собой. Рассмотрим на примере:
В производстве нового медицинского препарата необходима большая осторожность, потому что повышенная доза одного из входящих в состав компонентов может губительно сказаться на жизни пациентов. Рассчитать передозировку на химическом уровне не представляется возможным. Поэтому, перед запуском в продажу, медицинский препарат испытывают на кроликах либо крысах.
В случае, если в результате применения большинство животных не выживает, препарат в продажу не допускается, если, наоборот, все подопытные животные выжили – лекарство поступает в аптечную сеть. В первом случае медицинский препарат не был токсичен, просто во время испытания допустили ошибку и лекарство посчитали токсичным из-за гибели подопытных животных, и, соответственно, запретили к продаже — А=1.
Во втором случае, в процессе другого испытания, проверяя другую партию препарата было принято решение, что он не токсичен и препарат был допущен к продаже. Однако, в действительности он был токсичен — А=2. В первой ситуации, компания-поставщик понесет убытки, потому что всю партию медицинского препарата придется уничтожить и начать производство с нуля. Во втором случае, при покупке и употреблении препарата возможна смерть пациентов.
Для того, чтобы исключить ошибку, необходимо проверить правильность нулевой гипотезы
Для этого существует несколько этапов:
— устанавливается допустимое значение ошибочной вероятности (Р=0,05),
- — подбирается статистика для эталона 1,
- — определяется область допустимых значений,
- — рассчитывается значение тестовой статистики (Т),
- — в случае, если статистика (Т) входит в область принятия нулевой теории, то нулевая гипотеза (и предположения) верны.
По этому принципу действует статистика: при правильной проверке нулевая гипотеза будет либо принята, либо отвергнута. Первые три этапа проверки самые сложные, чаще всего их доверяют специалистам-математикам, 4 и 5 пункты, зная статистические методы, может применить любой человек.