Формула критерия стьюдента для независимых выборок. Когда и как применять Критерий Стьюдента (t-test), проверка нормальности данных в среде R

Критерий Стьюдента для независимых выборок

Критерий Стьюдента (t -тест Стьюдента или просто «t -тест») применяется, если нужно сравнить только две группы количественных признаков с нормальным распределением (частный случай дисперсионного анализа). Примечание: этим критерием нельзя пользоваться, сравнивая попарно несколько групп, в этом случае необходимо применять дисперсионный анализ. Ошибочное использование критерия Стьюдента увеличивает вероятность «выявить» несуществующие различия. Например, вместо того, чтобы признать несколько методов лечения равно эффективными (или неэффективными), один из них объявляют лучшим.

Два события называются независимыми, если наступление одного из них никак не влияет на наступление другого. Аналогично, две совокупности можно назвать независимыми, если свойства одной из них никак не связаны со свойствами другой.

Пример выполнения t -теста в программе STATISTICA.

Женщины в среднем ниже мужчин, однако, это не является результатом того, что мужчины оказывают какое-либо влияние на женщин - дело здесь в генетических особенностях пола. С помощью t- теста необходимо проверить, имеется ли статистически значимое различие между средними значениями роста в группах мужчин и женщин. (В учебных целях мы допускаем, что данные о росте подчиняются закону нормального распределения и поэтому t- тест применим).

Рисунок 1. Пример оформления данных для выполнения t-

Обратите внимание на то, как оформлены данные на рисунке 1. Как и при построении графиков типа Whisker plot или Box-whisker plot , в таблице имеются две переменные: одна из них - группирующая (Grouping variable ) («Пол») - содержит коды (муж и жен), позволяющие программе установить, какие из данных о росте принадлежат какой группе; вторая - т.н. зависимая переменная (Dependent variable ) («Рост») - содержит собственно анализируемые данные. Однако при выполнении t- теста для независимых выборок в программе STATISTICA возможен и другой вариант оформления - данные для каждой из групп («Мужчины» и «Женщины») можно ввести в отдельные столбцы (рисунок 2).

Рисунок 2. Еще один вариант оформления данных для выполнения t- теста для независимых выборок

Для выполнения t- теста для независимых выборок необходимо выполнить следующие действия:

1-а. Запустить модуль t- теста из меню Statistics > Basic statistics/Tables > t -test , independent, by groups (если в таблице с данными есть группирующая переменная, см.рисунок 3)​

ИЛИ

1-б. Запустить модуль t- теста из меню Statistics > Basic statistics/Tables > t -test, independent, by variables (если данные внесены в самостоятельные столбцы, см. рисунок 4).

Ниже описывается вариант теста, при котором в таблице с данными имеется группирующая переменная.

2. В открывшемся окне нажать кнопку Variables и указать программе, какая из переменных таблицы Sreadsheet является группирующей, а какая - зависимой (рисунки 5-6).

Рисунок 5. Выбор переменных для включения в t -тест

Рисунок 6. Окно с выбранными переменными для проведения t -теста

3. Нажать на кнопку Summary: T-tests .

Рисунок 7. Результы t -теста для независимых выборок

В итоге программа выдаст рабочую книгу Workbook , содержащую таблицу с результатами t -теста (рисунок 7 ). Эта таблица имеет несколько столбцов:

  • Mean (муж) - среднее значение роста в группе «Мужчины»;
  • Mean (жен) - среднее значение роста в группе «Женщины»;
  • t- value : значение рассчитанного программой t -критерия Стьюдента;
  • df - число степеней свободы;
  • P - вероятность справедливости гипотезы о том, что сравниваемые средние значения не различаются. Фактически, это самый главный результат анализа, поскольку именно значение P говорит, верна ли проверяемая гипотеза. В нашем примере P > 0.05, из чего можно сделать вывод о том, что статистически значимые различия между ростом мужчин и женщин отсутствуют.
  • Valid N (муж) - объем выборки «Мужчины»;
  • Valid N (жен) - объем выборки «Женщины»;
  • Std. dev . (муж) - стандартное отклонение выборки «Мужчины»;
  • Std. dev . (жен) - стандартное отклонение выборки «Женщины»;
  • F-ratio, Variances - значение F-критерия Фишера, с помощью которого проверяется гипотеза о равенстве дисперсий в сравниваемых выборках;
  • P, Variances - вероятность справедливости гипотезы о том, что дисперсии сравниваемых выборок не различаются.

История

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс . В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий . Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Двухвыборочный t-критерий для независимых выборок

В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:

В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:

Где M 1 ,M 2 - средние арифметические, σ 1 ,σ 2 - стандартные отклонения, а N 1 ,N 2 - размеры выборок.

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

где M d - средняя разность значений, а σ d - стандартное отклонение разностей.

Количество степеней свободы рассчитывается как

Одновыборочный t-критерий

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения :

Количество степеней свободы рассчитывается как

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна-Уитни . Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Автоматический расчет t-критерия Стьюдента


Wikimedia Foundation . 2010 .

  • Гиннесс
  • Геохимический резервуар

Смотреть что такое "T-критерий Стьюдента" в других словарях:

    Критерий Стьюдента t-к - Критерий Стьюдента, t к. * крытэрый Ст’юдэнта, t к. * Student’s criterion or t c. or S. t test статистический критерий существенности разности между сравниваемыми средними. Определяется отношением этой разности к ошибке разности: При значениях t… … Генетика. Энциклопедический словарь

    Критерий Стьюдента - t критерий Стьюдента общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства… … Википедия

    критерий Стьюдента - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: angl. Student’s test rus. критерий Стьюдента … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    критерий Стьюдента - Статистический критерий, в котором, в предположении нулевой гипотезы, используемая статистика соответствует t распределению (распределению Стьюдента). Примечание. Вот примеры применения этого критерия: 1. проверка равенства среднего из… … Словарь социологической статистики

    КРИТЕРИЙ СТЬЮДЕНТА - Биометрический показатель достоверности разницы (td) между средними значениями двух сравниваемых между собой групп животных (M1 и М2) по какому либо признаку. Достоверность разницы определяется по формуле: Полученное значение td сравнивается с… … Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных

    КРИТЕРИЙ СТЬЮДЕНТА - оценивает близость двух средних значений с точки зрения отнесения или не отнесения ее к случайной (при заданном уровне значимости), отвечая на вопрос о том, отличаются ли средние значения статистически достоверно друг от друга }

 

Пожалуйста, поделитесь этим материалом в социальных сетях, если он оказался полезен!