[МУЗЫКА] [МУЗЫКА] [ШУМ] Всем привет! Мы начинаем второй модуль нашего курса, который будет посвящен сравнению нескольких выборок. Если в первом модуле мы разбирались с идеей сравнения групп, в принципе, и говорили об одновыборочных и двухвыборочных критериях, то в этом модуле мы продолжим разговор, идея будет та же, сравнение групп, но групп уже будет больше, чем две, то есть k выборок. И здесь мы также поговорим о параметрических, о непараметрических, о связанных, о несвязанных — обо всем вот этом вот, а также обсудим несколько специфических задач. Эта лекция посвящена параметрическому тесту сравнения k независимых выборок, то есть это такой специфический, но достаточно распространенный метод, часто используемый, однофакторный или одномерный дисперсионный анализ, который используется для того, чтобы сравнивать три и более групп, и который является параметрическим методом, то есть для того чтобы мы могли использовать однофакторный или одномерный дисперсионный анализ, у нас опять-таки нужны количественные данные — метрическая шкала — и нормальность распределения или распределение, близкое к нормальному по крайней мере. Кроме того, однофакторный дисперсионный анализ хорошо работает, когда дисперсии в группах равны. Такие вот три ограничения. Редко встречаются в природе, но когда встречаются, мы можем использовать этот метод с удовольствием. Вот формула, вы сейчас видите формулу критерия Фишера. Что в этой формуле происходит? Если у нас в критерии Стьюдента мы видели в числителе две средних, то есть мы сравнивали среднюю в группе одной и среднюю в группе другой, то критерий Фишера соотносит немножко другие вещи, то есть то, что мы видим в числителе — это разница между группами. То есть это межгрупповая дисперсия — это то, насколько сильно отличаются наши группы, то, что нам, собственно, нужно оценить. То, что у нас в знаменателе — это внутригрупповая дисперсия. Это то, насколько разнообразна каждая из групп внутри себя. И по идее, логично, что у нас группы отличаются тогда, когда они очень сходны внутри себя и сильно отличаются между собой. Нулевая гипотеза, которая проверяется критерием Фишера, утверждает, что все группы равны — все сравниваемые группы, там значения совпадают. Альтернативная гипотеза говорит не то, что там все различаются, а то, что как минимум одна из групп отличается от всех остальных. И это и возможность, и ограничение — увидим дальше, собственно, что из этого следует. Сейчас запоминаем: соотношение межгрупповой и внутригрупповой дисперсии, нулевая гипотеза — равенство всех групп, альтернативная гипотеза — отличие хотя бы одной группы от всех остальных. Фактически что происходит в критерии Фишера. Вот вы видите две ситуации сейчас на картинке. Одна ситуация — когда у нас вот с левой стороны, когда у нас группы внутренне очень похожи, то есть диаметр кружочков небольшой, дисперсия внутри групп невелики, при этом разница между группами очевидна. Они достаточно далеко отстоят друг от друга, они не пересекаются, и в таком случае мы можем сказать, что да — группы по этому признаку у нас различаются: одна больше, средняя и меньше и, скорее всего, существенно. Так ситуация, которая справа — это ситуация противоположная. Межгрупповые различия у нас, может быть, даже есть, может быть, даже средние в группах, может быть, различаются сходным образом. Но внутригрупповой разброс настолько велик, что межгрупповые различия на его фоне незаметны, то есть вот эта вот разница внутри групп настолько велика, что сравнивать нечто межгрупповое, может быть, даже не имеет смысла. И критерий Фишера, соответственно, позволяет нам соотнести, насколько отличаются группы, насколько они компактны внутри и насколько они отличны между собой. Рассмотрим применение этого критерия на примере. Помните, в прошлом модуле мы рассматривали ситуацию со студентами, которые ходят в бары, второкурсники и четверокурсники, и выяснили, что второкурсники у нас ходят в бары чаще, но тратят меньше, четверокурсники ходят в бары реже, но тратят там больше. Редко, но метко, скорее всего, потому что начинают зарабатывать, появляются деньги, но сокращается время, которые они могут использовать вот на такие развлечения. Мы хотели туда добавить преподавателей в картину, но не смогли, потому что критерий был двухвыборочный. Критерий Фишера и вот однофакторный дисперсионный анализ позволяет нам снять этот недостаток, и мы можем, наконец-то, добавить преподавателей на карту. Допустим, мы доопросили еще 50 преподавателей, получили вот такую вот картину — мы видим описательные статистики, групповые средние, также мы видим выборочное значение статистики критерия Фишера, который мы можем сравнивать с табличным, если захотим. Также мы видим, достигнут ли выборочный уровень значимости, который мы можем сравнивать с критическим, который у нас по умолчанию 0.05, то есть мы позволяем себе ошибаться в 5 % случаев. Сравниваем достигнутый уровень значимости с критическим и видим, что он меньше, чем 0.05, и говорим, что есть у нас статистически значимая разница между тремя группами. Что это значит, мы пока не знаем, но знаем, что группы различаются. Для того чтобы понять, в чем именно состоит это различие и какие именно группы и как отличаются друг от друга, у нас есть два пути. Во-первых, мы можем прибегнуть к графическому анализу, то есть просто построить график средних, например, нанести и увидеть, что там как. Другой вариант — это множественные сравнения. Этот вариант немножко сложнее, но бывают ситуации, когда он необходим. Давайте посмотрим на графический анализ. Вот предположим: мы наносим среднее значение в группах на график и видим, что в случае с посещениями баров у нас ситуация достаточно прозрачна: второкурсники — чаще, четверокурсники — реже, преподаватели — еще реже. То есть чем старше человек, чем сложнее жизнь и все такое прочее — могут быть другие объяснения, — тем реже люди ходят в бары. Если мы посмотрим на сумму, то здесь уже все не так очевидно, второкурсники тратят, очевидно, меньше, потому что подавляющее большинство их них, как правило, не работают, денег меньше, поэтому и тратят, собственно, меньше. Преподаватели с четверокурсниками — мы видим, что похожи. Средняя немножко различается — четверокурсники у нас тратят чуть-чуть больше преподавателей, но чуть-чуть — это немножечко ненаучно. Как мы можем отличить вот это вот чуть-чуть от настоящего отличия? Есть различие между четверокурсниками и преподавателями в затратах или нет? Вот для того чтобы оценить это чуть-чуть, избавить его от субъективности и сделать статистически обоснованный вывод и есть инструмент множественных сравнений, который реализован и на который мы в практической части модуля посмотрим. Сейчас расскажу просто идею: что мы берем каждую пару групп и сравниваем их между собой — второй с четвертым, четвертый с преподавателями, второй с преподаватели — и попарно оцениваем вот эти вот различия: какие значимые, какие незначимые. И тогда, собственно, можем окончательно делать вывод о том, в чем же, собственно, заключается наше различие, и какие из них статистически серьезные, а какие — так, возможно, случайные и вызваны какими-то выборочными особенностями. Вот такой вот метод. Да, параметрический тест для сравнения k групп, где k — больше, чем два. Ограничения есть, естественно, которые накладываются тем, что этот тест параметрический, основан на средних, на дисперсиях, соответственно, шкала должна быть метрическая, а распределение должно быть нормальным. Но что делать, если у нас не соблюдается одно или несколько условий? Как мы можем сравнить три и более групп, если параметрические требования не соблюдены? Об этом поговорим в следующей лекции.