Введение:

Проверка гипотез играет решающую роль в статистическом анализе и принятии решений. Предоставляя структурированную основу для оценки предположений и составления выводов, оно позволяет исследователям и аналитикам данных делать осознанный выбор на основе фактических данных. В этом подробном руководстве мы рассмотрим различные аспекты проверки гипотез и ее практическое применение. применения в разных областях. Пристегнитесь и приготовьтесь к авантюрному путешествию по миру проверки гипотез!

Что такое проверка гипотез?

Проверка гипотез относится к статистической процедуре, используемой для оценки достоверности утверждения или гипотезы о параметре совокупности. Его цель - предоставить доказательства, которые либо поддерживают, либо противоречат заявленному убеждению или предположению. Подвергая гипотезы тщательной проверке, проверка гипотез позволяет нам делать надежные выводы на основе данных.

В исследованиях и анализе данных проверка гипотез имеет огромное значение. Он позволяет исследователям принимать решения на основе данных, сопоставляя гипотезы с имеющимися доказательствами. Таким образом, он помогает избежать ошибочных предположений и обеспечивает достоверность научных результатов.

В основе проверки гипотез лежат две ключевые концепции: нулевая гипотеза и альтернативная гипотеза. Нулевая гипотеза (H₀) представляет позицию по умолчанию, утверждая, что нет существенной разницы или связи между переменными. Гипотеза (обычно нулевая гипотеза утверждает, что ничего нового не происходит). Мы пытаемся собрать доказательства, чтобы отвергнуть нулевую гипотезу. гипотеза. С другой стороны, альтернативная гипотеза (H₁) представляет альтернативную точку зрения, предполагая, что действительно существует значительная разница или взаимосвязь. Он представляет исследовательскую гипотезу или утверждение, которое исследователь хочет подтвердить с помощью статистического анализа.

Важно отметить, что невозможность отвергнуть нулевую гипотезу не обязательно означает, что нулевая гипотеза верна; это просто означает, что нет достаточных доказательств в поддержку альтернативной гипотезы.

Проверка гипотез в некотором смысле похожа на суд присяжных. В суде присяжных H0 подобен оправдательному вердикту, а Ha — обвинительному вердикту. В суде присяжных вы исходите из того, что подсудимый невиновен, если обвинение не может доказать вне разумных сомнений, что он или она виновен. Если присяжные говорят, что доказательства не вызывают разумных сомнений, они отклоняют H0, невиновного, в пользу Ha, виновного.

Типы нулевых гипотез и их значение:

Когда дело доходит до формулирования нулевых гипотез, существует два основных типа: простые нулевые гипотезы и составные нулевые гипотезы.

Простая нулевая гипотеза – это гипотеза, указывающая точное значение параметра генеральной совокупности. Например, можно указать, что средний вес определенного вида птиц равен 100 граммам. Принятие или отклонение простой нулевой гипотезы зависит от того, предоставляют ли данные достаточно доказательств для ее опровержения.

Напротив, составная нулевая гипотеза охватывает диапазон возможных значений параметров. Вместо указания точных значений он определяет область или интервал, в который попадает параметр. Его принятие или отклонение зависит от того, указывают ли данные значение параметра, попадающее в эту определенную область или за ее пределы.

Методы расчета проверки гипотез:

Подход к области отклонения:

Подход области отклонения является одним из широко используемых методов для проведения проверки гипотез. Он включает в себя определение критической области или области отбраковки, которая служит порогом для принятия решений на основе тестовой статистики.

Чтобы прийти к решению, подход области отбраковки включает в себя вычисление тестовой статистики и сравнение ее с критическими значениями, характерными для выбранного уровня значимости. Статистика теста представляет собой числовое значение, полученное из выборочных данных, и представляет степень, в которой наблюдаемые данные отклоняются от нулевой гипотезы. Критические значения, с другой стороны, являются предопределенными пороговыми значениями, которые помогают определить, попадает ли тестовая статистика в область отклонения.

Вычислив тестовую статистику и сравнив ее с критическими значениями, можно принять решение. Если тестовая статистика попадает в область отклонения, нулевая гипотеза отклоняется в пользу альтернативной гипотезы. И наоборот, если тестовая статистика не попадает в область отклонения, принимается нулевая гипотеза.

Подход на основе p-значения:

Подход с использованием p-значения является альтернативным методом проверки гипотез. Он включает в себя вычисление p-значения, которое представляет вероятность получения тестовой статистики, столь же экстремальной, как наблюдаемое значение, или более экстремальной, при условии, что нулевая гипотеза верна.

Чтобы принять решение с использованием подхода p-значения, рассчитанное p-значение сравнивается с заданным уровнем значимости (α). Уровень значимости действует как порог для определения силы доказательства против нулевой гипотезы. Если p-значение меньше уровня значимости, нулевая гипотеза отклоняется. И наоборот, если p-значение больше уровня значимости, принимается нулевая гипотеза.

Шаги, связанные с проведением проверки нулевой гипотезы с использованием подхода области отклонения:

Известное стандартное отклонение населения:

Когда известно стандартное отклонение популяции, при проверке нулевой гипотезы обычно выполняются следующие шаги:

Формулирование нулевой и альтернативной гипотез: Четко сформулируйте нулевую гипотезу (H₀) и альтернативную гипотезу (H₁), выразив их в терминах интересующего параметра генеральной совокупности.

Определение уровня значимости (α): Определите приемлемый уровень риска совершения ошибки первого рода, то есть вероятность отклонения истинной нулевой гипотезы.

Расчет статистики теста и критических значений. Используйте соответствующую формулу статистики теста на основе данных выборки, стандартного отклонения генеральной совокупности и размера выборки. Сравните рассчитанную статистику теста с критическими значениями, соответствующими выбранному уровню значимости.

Принятие решения и интерпретация результатов: если статистика теста попадает в область отклонения, отклоните нулевую гипотезу в пользу альтернативной гипотезы. Интерпретируйте результаты в контексте вопроса исследования и заданного уровня значимости.

Example:

Suppose a company is evaluating the impact of a new training program on the productivity of
its employees. The company has data on the average productivity of its employees before
implementing the training program. The average productivity was 50 units per day with a
known population standard deviation of 5 units. After implementing the training program, the
company measures the productivity of a random sample of 30 employees. The sample has an
average productivity of 53 units per day. The company wants to know if the new training
program has significantly increased productivity.

Solution:

To conduct a hypothesis we will use z-test as population std deviation is known.

Step 1: State the Null and Alternative Hypotheses:

Null Hypothesis (H0): The new training program has no significant impact on productivity. (μ = 50)
Alternative Hypothesis (Ha): The new training program has significantly increased productivity. (μ > 50)

Step 2: Set the Significance Level:

Determine the desired significance level (α) to make a decision. Let's assume α = 0.05 (5%).

Step 3: Compute the Test Statistic:

Calculate the test statistic, which is the z-score, using the sample mean, population mean, sample size, and population standard deviation.
Formula: z = (sample mean - population mean) / (population standard deviation / √sample size)
Given data:
Sample mean (x̄) = 53
Population mean (μ) = 50
Population standard deviation (σ) = 5
Sample size (n) = 30
Substitute the values into the formula:
z = (53 - 50) / (5 / √30)
z = 3 / (5 / √30)
z ≈ 3 / 0.9129
z ≈ 3.2832
Step 4: Determine the Critical Value:

Since the alternative hypothesis is one-tailed (μ > 50), find the critical value from the standard normal distribution for the given significance level (α) using a z-table or statistical software.
At α = 0.05, the critical value is approximately 1.645.
Step 5: Compare the Test Statistic with the Critical Value:

If the test statistic (z-score) is greater than the critical value, reject the null hypothesis; otherwise, fail to reject the null hypothesis.
In this case, 3.2832 > 1.645, so we reject the null hypothesis.

Стандартное отклонение населения неизвестно:

Когда стандартное отклонение популяции неизвестно, обычно выполняются следующие шаги:

Введение в t-распределение и степени свободы: Понимание концепции t-распределения, которая учитывает неопределенность, возникающую при оценке стандартного отклонения совокупности от выборочных данных. Степени свободы (df) играют роль в определении формы t-распределения и влияют на критические значения, необходимые для принятия решений.

Расчет статистики теста и критических значений с использованием t-распределения: используйте соответствующую формулу статистики теста на основе выборочных данных и размера выборки. Определите критические значения, характерные для выбранного уровня значимости и степеней свободы.

Принятие решения и интерпретация результатов: Сравните рассчитанную статистику теста с критическими значениями, полученными из t-распределения. Если тестовая статистика попадает в область отклонения, отклоните нулевую гипотезу. Рассмотрите практические последствия решения и оцените значимость полученных результатов.

Question:
A company wants to determine if a new marketing campaign has increased the average number of website visitors per day. 
The company collects a random sample of 25 days before the campaign and records the number of website visitors. 
The sample has a mean of 120 visitors per day and a sample standard deviation of 15 visitors per day.
After running the campaign for a month, the company collects a random sample of 30 days and finds a mean of 130 visitors per day. 
Conduct a hypothesis test to determine if the marketing campaign has significantly increased the average number 
of website visitors per day at a 5% significance level.

Solution:

Step 1: State the Null and Alternative Hypotheses:

Null Hypothesis (H0): The new marketing campaign has no significant impact on the average number of website visitors per day. (μ = μ0)
Alternative Hypothesis (Ha): The new marketing campaign has significantly increased the average number of website visitors per day. (μ > μ0)

Step 2: Set the Significance Level:

Determine the desired significance level (α) to make a decision. Let's assume α = 0.05 (5%).

Step 3: Compute the Test Statistic:

Calculate the test statistic, which is the t-score, using the sample mean, hypothesized population mean, sample size, and sample standard deviation.
Formula: t = (sample mean - hypothesized mean) / (sample standard deviation / √sample size)
Given data:
Sample mean (x̄) = 130
Hypothesized mean (μ0) = 120
Sample standard deviation (s) = 15
Sample size (n) = 30
Substitute the values into the formula:
t = (130 - 120) / (15 / √30)
t = 10 / (15 / √30)
t ≈ 10 / 2.7386
t ≈ 3.6516
Step 4: Determine the Degrees of Freedom:

Degrees of freedom (df) for a t-distribution is equal to the sample size minus 1.
df = 30 - 1 = 29

Step 5: Determine the Critical Value:

Since the alternative hypothesis is one-tailed (μ > μ0), find the critical value from the t-distribution for the given significance level (α) and degrees of freedom (df). This can be done using a t-table or statistical software.
At α = 0.05 and df = 29, the critical value is approximately 1.699.

Step 6: Compare the Test Statistic with the Critical Value:

If the test statistic (t-score) is greater than the critical value, reject the null hypothesis; otherwise, fail to reject the null hypothesis.
In this case, 3.6516 > 1.699, so we reject the null hypothesis.

Ключевые концепции проверки гипотез:

Регион отклонения:

Область отклонения играет жизненно важную роль в проверке гипотез. Он определяет диапазон значений тестовой статистики, который приводит к отклонению нулевой гипотезы. Определение области отклонения зависит от выбранного уровня значимости (α) и зависит от характера вопроса исследования.

Например, в фармацевтических исследованиях область отклонения определяет порог, при котором результаты эксперимента считаются статистически значимыми. Определяя критерии принятия или отклонения эффективности лекарственного средства, область отклонения направляет процесс принятия решений в области фармацевтики.

Критическое значение:

Критическое значение является ключевым компонентом проверки гипотез. Он обозначает порог, при котором нулевая гипотеза отвергается в пользу альтернативной гипотезы. Критические значения выводятся на основе выбранного уровня значимости и основного распределения вероятностей.

Например, в контроле качества критические значения используются для определения того, соответствует ли производственная партия указанным стандартам. Определяя порог, за которым качество продукта считается неприемлемым, критические значения играют решающую роль в обеспечении последовательной практики контроля качества.

Уровень значимости и уровень достоверности:

Уровень значимости (α) и уровень достоверности являются тесно связанными понятиями при проверке гипотез. Уровень значимости определяет вероятность совершения ошибки первого рода, которая возникает при ошибочном отклонении нулевой гипотезы. С другой стороны, уровень достоверности представляет собой уровень определенности или уверенности в оцениваемых параметрах.

Определение соответствующих уровней значимости требует тщательного рассмотрения контекста исследования и возможных последствий совершения ошибок. Например, в политических опросах более высокий уровень достоверности обеспечивает большую уверенность в точности результатов опроса, позволяя более надежно прогнозировать результаты выборов.

p-значение:

Значение p является важным показателем при проверке гипотез. Он количественно определяет силу доказательств против нулевой гипотезы на основе наблюдаемых данных. Меньшее значение p предполагает более сильные доказательства против нулевой гипотезы, указывая на то, что наблюдаемые данные маловероятны, если нулевая гипотеза верна.

Интерпретация различных диапазонов p-значений позволяет принимать нюансированные решения. Небольшое значение p (например, менее 0,05) дает основания для отклонения нулевой гипотезы, в то время как большее значение p не дает достаточных оснований для отклонения. В A/B-тестировании для оптимизации веб-сайта p-значение помогает определить, существенно ли влияют изменения на веб-сайте на поведение пользователей.

Ошибки 1-го и 2-го типа:

Ошибки типа 1 и типа 2 представляют собой неотъемлемый риск при проверке гипотез. Ошибка типа 1 возникает, когда нулевая гипотеза ошибочно отвергается, что приводит к принятию альтернативной гипотезы, которая может быть неверной. С другой стороны, ошибка типа 2 возникает, когда нулевая гипотеза принимается неправильно, что приводит к отклонению истинной альтернативной гипотезы.

Уровень значимости (α) имеет прямое отношение к частоте ошибок 1-го рода. Более высокий уровень значимости увеличивает вероятность совершения ошибки первого рода, тем самым снижая порог отклонения нулевой гипотезы.

Примеры из сферы здравоохранения и уголовного правосудия иллюстрируют важность понимания ошибок типа 1 и типа 2. В здравоохранении ошибка типа 1 возникает, когда пациенту ставится неправильный диагноз, что приводит к ненужному лечению или вмешательству. В уголовном правосудии ошибка 2-го типа возникает, когда невиновное лицо ошибочно осуждается из-за недостаточности доказательств.

Стратегии уменьшения числа ошибок 1 и 2 типа:

Минимизация ошибок типа 1 и типа 2 требует тщательного баланса уровня значимости (α) и статистической мощности. Уровень значимости влияет на частоту ошибок 1-го типа, а мощность связана с вероятностью правильного отклонения ложной нулевой гипотезы (избегая ошибок 2-го типа).

Определение подходящего размера выборки играет решающую роль в снижении количества ошибок. Обеспечив адекватный размер выборки, можно увеличить статистическую мощность, тем самым повысив чувствительность проверки гипотез. Медицинские испытания и внедрение контроля качества являются практическими областями, в которых стратегии минимизации ошибок типа 1 и типа 2 имеют первостепенное значение.

Односторонние и двусторонние (двусторонние) тесты:

Односторонние и двусторонние тесты служат разным целям при проверке гипотез. Односторонний тест используется для оценки того, является ли параметр больше или меньше определенного значения. Основное внимание уделяется установлению направленности эффекта или различия.

Напротив, двусторонний тест проверяет, значительно ли параметр отличается от определенного значения, без назначения предпочтительного направления. Это позволяет обнаруживать любое значительное отклонение от нулевой гипотезы, независимо от направления.

Выбор между односторонними и двусторонними тестами зависит от исследовательского вопроса и характера проверяемой гипотезы. Каждый подход имеет свои преимущества и недостатки, которые следует рассматривать в свете конкретного контекста и целей.

Приложения для проверки гипотез и машинное обучение:

Проверка гипотез находит практическое применение в различных аспектах машинного обучения. При выборе функций для моделей машинного обучения проверка гипотез может использоваться для определения наиболее важных переменных. Оценивая значимость каждого признака по отношению к целевой переменной, можно отбросить менее информативные признаки, что приведет к повышению производительности модели.

Проверка гипотез также играет решающую роль в оценке производительности модели и сравнении различных алгоритмов. Подвергая алгоритмы проверке гипотез, исследователи могут оценить, значительно ли один алгоритм превосходит другой. Это помогает в выборе наиболее эффективного алгоритма для конкретной задачи.

Реальных примеров проверки гипотез в приложениях машинного обучения предостаточно. При анализе тональности проверка гипотезы может определить, есть ли существенная разница в тональности между двумя группами текстов. При обнаружении мошенничества проверка гипотез может выявить закономерности, отличающие мошеннические транзакции от законных.

Заключение:

В этом подробном руководстве по проверке гипотез мы углубились в фундаментальные концепции, различные методы и практическое применение этого статистического инструмента. Понимая проверку гипотез, исследователи, аналитики и специалисты по данным могут делать надежные выводы, принимать обоснованные решения и вносить свой вклад в развитие знаний в соответствующих областях. Примите авантюрный дух проверки гипотез и раскройте его силу в ваших усилиях, основанных на данных!