Сравнение средних значений в двух группах.

Как продвинуть сайт на первые места?

Вы создали или только планируете создать свой сайт, но не знаете, как продвигать? Продвижение сайта – это не просто процесс, а целый комплекс мероприятий, направленных на увеличение его посещаемости и повышение его позиций в поисковых системах.

Ускорение продвижения

Если вам трудно попасть на первые места в поиске самостоятельно, попробуйте технологию Буст, она ускоряет продвижение в десятки раз, а первые результаты появляются уже в течение первых 7 дней. Если ни один запрос у вас не продвинется в Топ10 за месяц, то в SeoHammer за бустер вернут деньги.

Начать продвижение сайта

Сервис онлайн-записи на собственном Telegram-боте

Тот, кто работает в сфере услуг, знает — без ведения записи клиентов никуда. Мало того, что нужно видеть свое расписание, но и напоминать клиентам о визитах тоже. Нашли самый бюджетный и оптимальный вариант: сервис VisitTime.
Для новых пользователей первый месяц бесплатно.

Чат-бот для мастеров и специалистов, который упрощает ведение записей:

— Сам записывает клиентов и напоминает им о визите;
— Персонализирует скидки, чаевые, кэшбэк и предоплаты;
— Увеличивает доходимость и помогает больше зарабатывать;

Начать пользоваться сервисом

Сравнение средних значений в двух группах.

Для чего такое сравнение применяется? Предположим, существуют две большие группы людей (скажем, жители Москвы и Санкт-Петербурга). Требуется проверить, одинакова ли в этих группах величина некоторого параметра, измеряемого по интервальной шкале (например, одинакова ли зарплата москвичей и петербуржцев).

Очевидно, что если взять произвольного москвича и произвольного петербуржца, то их зарплаты вряд ли совпадут. Проверяется равенство средних значений параметров в группах. Иными словами: если мы опросим всех жителей Москвы и Санкт-Петербурга, то совпадут ли средние значения зарплаты в этих городах? Понятно, что всех жителей опросить нереально. Как правило, исследователь имеет выборку из N₁ представителей одной группы (скажем, жителей Москвы) и N₂представителей другой группы (жителей Петербурга). В общем случае N₁не равно N₂.

Первое, с чего начинается проверка равенства средних значений – это с их вычисления (это сумма всех значений, деленная на их количество):

Скорее всего, вычисленные величины средних значений между собой не совпадут. Однако, различие между ними может оказаться статистически не значимым. Мы ведь опросили не всех жителей Москвы и Петербурга, поэтому в другой раз, опросив других людей, мы можем и не получить такой значительной разности средних значений, а возможно, эта разность даже поменяет знак. Значит, надо оценить, насколько разность средних значений велика по сравнению с разбросом значений в группах. Схематически это можно представить на таком рисунке:

Вслед за средними значениями требуется вычислить стандартные отклонения в каждой группе – именно они служат мерой разброса. Формулы для их вычисления уже приводились:

Итак, после первого этапа мы должны иметь значения

Теперь формулируем гипотезу: «Средние значения в группах равны». В нашем примере эта гипотеза принимает вид «Средний доход жителей Москвы равен среднему доходу жителей Санкт-Петербурга». Математически гипотезу можно записать примерно так:

(но под

в такой записи надо понимать средние параметры по популяции, а не их оценочные значения по выборкам). Альтернативную гипотезу сформулируем следующим образом: «Средние значения в группах не равны».

Забиваем Сайты В ТОП КУВАЛДОЙ - Уникальные возможности от SeoHammer

Каждая ссылка анализируется по трем пакетам оценки: SEO, Трафик и SMM. SeoHammer делает продвижение сайта прозрачным и простым занятием. Ссылки, вечные ссылки, статьи, упоминания, пресс-релизы - используйте по максимуму потенциал SeoHammer для продвижения вашего сайта.

Что умеет делать SeoHammer

— Продвижение в один клик, интеллектуальный подбор запросов, покупка самых лучших ссылок с высокой степенью качества у лучших бирж ссылок.
— Регулярная проверка качества ссылок по более чем 100 показателям и ежедневный пересчет показателей качества проекта.
— Все известные форматы ссылок: арендные ссылки, вечные ссылки, публикации (упоминания, мнения, отзывы, статьи, пресс-релизы).
— SeoHammer покажет, где рост или падение, а также запросы, на которые нужно обратить внимание.

SeoHammer еще предоставляет технологию Буст, она ускоряет продвижение в десятки раз, а первые результаты появляются уже в течение первых 7 дней.

Зарегистрироваться и Начать продвижение

В случае, если гипотеза верна, разность полученных в эксперименте средних значений в двух группах обусловлена только статистическим разбросом. Чем больше разность

, тем с меньшей вероятностью мы будем ее наблюдать. Осталось оценить вероятность возникновения той разности, которая была измерена в нашем эксперименте. Если эта вероятность окажется достаточно малой, то мы сделаем вывод, что только статистическим разбросом эту разность объяснить не удается, поэтому средние значения в группах не будут равны (т.е. мы отвергнем проверяемую гипотезу).

Для оценки используется следующая величина:

Здесь

s* - усредненное значение стандартного отклонения, вычисляемое по формуле:

Математики определили, что в случае, если средние значения в популяции равны, величина t (случайная величина!) имеет распределение Стьюдента с числом степеней свободы, равным d=N₁+N₂-2. То есть, мы знаем вид распределения t-величины, а значит, функцию и плотность этого распределения.

С практической точки зрения функция распределения дает возможность по значению t-величины определить вероятность того, что данная (или большая данной) величина t будет наблюдаться (благодаря статистическому разбросу), если на самом деле в популяции средние значения равны. Эта вероятность, как ранее уже говорилось, называется уровнем значимости и обозначается буквой α. Как правило, зависимость t от α смотрят по таблице (см. Приложение 3), выглядящей примерно так:

В ячейках стоят значения t-величины. Предположим, мы получили t=4 в эксперименте с тремя наблюдениями в 1-й группе и 4-мя наблюдениями во 2-й группе. Тогда сначала мы должны найти число степеней свободы (d=3+4-2=5), затем в 5-й строчке найти величину t, близкую к нашей (t=4.03) и посмотреть, колонке с каким уровнем α это соответствует. Получаем α =0, 01.

Смысл полученного значения таков. Если мы проведем очень много подобных экспериментов, а средние значения на самом деле равны, то значения t-величины, большие или равные 4, мы будем получать с вероятностью 0, 01, т.е. в 1% экспериментов, или в одном эксперименте из ста. То есть, мы вряд ли получили бы такую большую разность средних значений только благодаря статистическому разбросу. Поэтому гипотезу о равенстве средних значений мы отвергаем и считаем, что средние значения НЕ равны. Если бы α было порядка 0.5, это бы означало, что такие, как наблюдаемые, значения t мы получали бы в каждом втором эксперименте. И мы бы приняли гипотезу о равенстве средних значений.

Сервис онлайн-записи на собственном Telegram-боте

Попробуйте сервис онлайн-записи VisitTime на основе вашего собственного Telegram-бота:
— Разгрузит мастера, специалиста или компанию;
— Позволит гибко управлять расписанием и загрузкой;
— Разошлет оповещения о новых услугах или акциях;
— Позволит принять оплату на карту/кошелек/счет;
— Позволит записываться на групповые и персональные посещения;
— Поможет получить от клиента отзывы о визите к вам;
— Включает в себя сервис чаевых.

Для новых пользователей первый месяц бесплатно.

Зарегистрироваться в сервисе

Часто (ввиду ограниченности таблиц) гипотезу о равенстве средних значений проверяют в обратной последовательности:

1)Сначала выбирают уровень значимости, менее которого мы гипотезу отвергаем. Например, выбирают α =0, 05, соответствующий наблюдению наших значений t в 1-м случае из 20.

2)По этому α, зная число степеней свободы, мы находим по таблице критическое значение t-величины. Например, по α =0, 05 в эксперименте с 4 степенями свободы мы нашли бы t_крит=2, 78.

3)Сравниваем t_крит с полученным в нашем эксперименте значением. Если наше экспериментальное значение превышает критическое, т.е. t_эксп> t_крит, то мы отвергаем гипотезу, т.е. средние значения НЕ равны.

ПРИМЕР ПРОВЕРКИ РАВЕНСТВА СРЕДНИХ ЗНАЧЕНИЙ ПРИЗНАКА В ДВУХ ГРУППАХ.

Пусть требуется проверить, отличается или нет средний возраст женатых людей от среднего возраста холостых. Понятно, что речь идет о средних показателях по некоторой популяции (например, жителей города Тьмутараканска).

У нас имеется выборка из опроса жителей Тьмутараканска следующего вида:

Возраста женатых людей: 30, 28, 19, 19, 23, 19, 27, 24, 26, 20, 26 и 21 лет.

Возраста холостых: 29, 30, 21, 41, 32, 33, 18, 21, 18, 31, 27, 20 и 19 лет.

Проверяем нулевую гипотезу: «Средний возраст женатых жителей Тьмутараканска равен среднему возрасту холостых жителей Тьмутараканска». Для этого:

1) Считаем число респондентов в каждой группе: N₁=12, N₂=13

2) Теперь находим значения среднего возраста:

6) Определяем число степеней свободы: d=13+12-2=25-2=23.

7) Выбираем уровень значимости, начиная с которого гипотеза будет отвергнута. Например, возьмем α =0, 05. По таблице для d=23 и α =0, 05 находим t_крит.=2, 07.

8) Сравниваем экспериментальное значение t_эксп=1, 02 с критическим значением t_крит.=2, 07. Поскольку t_эксп< t_крит., мы не отвергаем нулевую гипотезу и считаем, что средние значения возраста женатых и холостых жителей Тьмутараканска равны.

Осталось сделать одно замечание. Применять формулу для t=величины, в которую входит усредненное значение дисперсии возможно, только если дисперсии в группах примерно равны, либо достаточно велики значения N₁ и N₂. Если это не так, то возможны неточности, связанные с тем, что распределение t-величины будет отличаться от t-распределения Стьюдента.

Иногда данные могут быть представлены в виде ответа на два вопроса (т.е. двух признаков), одним из которых является измеряемое по интервальной шкале значение некоторой величины, по которой можно вычислять средние значения (например, возраст), а другим – признак группы (номинальная шкала, например, семейное положение). Эти два столбца нетрудно переписать в виде двух групп значений возраста, после чего применять только что описанный метод.