• Наличие одной звездочки говорит о том, что коэффициент значим только на 10 %-ном уровне.
• Наличие двух звездочек говорит о значимости коэффициента на 5 %-ном уровне.
• Три звездочки информируют о значимости коэффициента на 1 %-ном уровне.
• Отсутствие звездочек говорит о незначимости коэффициента на 10 %-ном уровне.
Мы проверили незначимость коэффициентов при всех регрессорах, включенных в модель. Если мы хотим ориентироваться на 5 %-ный уровень значимости, то нужно удалить переменную с незначимым коэффициентом. Для того чтобы это сделать в окне с построенной моделью (в нашем случае это окно Модель 1, но, вообще говоря, это может быть Модель № в зависимости от того, сколько вы моделей построили до этого), выбираем пункт меню Правка – Изменить модель.
Рис. 4.4
В открывшемся окне выделяем переменную и красной стрелкой удаляем ее из независимых переменных.
Рис. 4.5
Обновленная модель представлена на рис. 4.6.
Рис. 4.6
Как видно из распечатки, все коэффициенты регрессии в обновленной модели значимы на 1 %-ном уровне (следовательно, и на 5 %-ном уровне они тоже значимы). Возможности t-теста не ограничиваются только проверкой незначимости коэффициентов при регрессорах. На самом деле проверка незначимости коэффициента является частным случаем проверки равенства коэффициента при регрессоре конкретному значению [2, 3].
Разберем это на примере. Проверим, а можем ли мы округлить коэффициент при переменной до 0,2. Сформулируем гипотезы для проверки этого предположения:
Для проверки такого рода гипотезы уже нельзя воспользоваться рассчитанным в GRETL значением t-статистики, а также р-значением, поэтому вычислим значение t-статистики для переменной самостоятельно: . Значение критической точки Стьюдента составит .
Сравниваем расчетную статистику и критическую и получаем, что , то есть (|–0,56 | < 1,96). В этом случае, мы можем принять нулевую гипотезу и округление коэффициента перед до 0,2 будет статистически корректно. Аналогичные гипотезы мы можем проверять для остальных коэффициентов регрессии.
Проверить, может ли коэффициент при регрессоре равняться заданному значению, позволяет также доверительный интервал [2, 3].
Используя данные из распечатки на рис. 4.6, можно построить доверительные интервалы для всех коэффициентов самостоятельно либо воспользоваться встроенной функцией GRETL для построения доверительного интервала.
Для этого в окне модели вызовем пункт меню Анализ – Доверительные интервалы для коэффициентов.
Рис. 4.7
Результатом работы данной функции является следующее окно (рис. 4.8).
Рис. 4.8
Истинное значение коэффициента при переменной с вероятностью 95 % накрывается интервалом .
Нужно обратить внимание на то, что с помощью доверительного интервала можно проверять незначимость коэффициентов при регрессорах. В случае, если доверительный интервал накрывает 0 (то есть истинное значение коэффициента может принимать нулевое значение), можно сделать вывод о том, что коэффициент не значим.
Еще одна возможность для проверки гипотез с помощью теста Стьюдента – это односторонние гипотезы [2, 3].
Разберем, как проводится односторонний t-тест на примере. Проверим, верно ли, что коэффициент перед переменной можно считать большим 0,2.
Значение расчетной статистики для этого теста будет такое же, как и в предыдущем тесте (проверка равенства коэффициента заданному значению). Критическая точка составит . Сравнивая расчетное значение статистики с критическим, получаем , то есть –0,56 < 1,65. Значит, гипотеза H0 принимается.
По сути, все разновидности t-теста и построение доверительного интервала для коэффициента – это две стороны одной медали. Полезные результаты можно получать и тем и другим способом, выбор способа ответа на вопросы о незначимости коэффициента при регрессоре и соотношения коэффициента регрессора с заданным значением возлагается на исследователя.
5. Проверка гипотезы о совместной незначимости коэффициентов
В рассматриваемой нами модели зависимости заработной платы после проверки незначимости коэффициентов при отдельных регрессорах осталось две независимых переменных: образование и опыт работы у текущего работодателя. Однако с экономической точки зрения очевидно, что на уровень заработной платы сотрудника могут влиять и некоторые другие факторы, например, уровень интеллекта (IQ), возраст, образование и заработок родителей, общий уровень знаний и проч. Когда мы отбираем регрессоры для модели, мы, с одной стороны, должны руководствоваться соображениями экономической обоснованности и осмысленности, а с другой – нужно иметь в виду и эконометрические аспекты. Так, например, нужно помнить, что если не включить существенные регрессоры в модель, оценка для дисперсии ошибок модели получится смещенная, и тогда тесты на незначимость будут работать некорректно. Если же включить несущественную переменную, оценки для коэффициентов хоть и будут несмещенные, но получатся неэффективными. Таким образом, отбирая регрессоры для модели, нужно учитывать как содержательные аспекты, так и эконометрические.
Предположим, что с точки зрения экономического смысла мы определились с регрессорами и решили построить следующую модель [файл с данными wage2.gdt]:
где – средняя заработная плата в месяц в долларах, – среднее число рабочих часов в неделю, – уровень IQ в баллах, – индекс знания своей области деятельности в баллах, – уровень образования в годах, – опыт работы в годах, – опыт работы у текущего работодателя в годах, – образование матери, – образование отца2.
На рис. 5.1 дана распечатка оцененной регрессии. По распечатке можно сделать вывод, что в целом регрессия значима, но не все коэффициенты значимы по отдельности.
На 5 %-ном уровне значимости сразу несколько коэффициентов перестают быть значимыми. Если бы не значим был лишь один коэффициент в модели, его можно было бы исключить, но в случае незначимости нескольких коэффициентов можно ли исключить соответствующие регрессоры из модели на том основании, что коэффициент каждого из них в отдельности не значим на 5 %-ном уровне? Чтобы ответить на этот вопрос, нужно вспомнить о том, что существенные регрессоры исключать из модели некорректно, но оставлять несущественные регрессоры в модели тоже не является правильным. Поэтому для того, чтобы понять, можно ли исключить все регрессоры, чьи коэффициенты не значимы на 5 %-ном уровне, или нужно исключить только некоторые из них и какие именно, необходимо провести тест на совместную незначимость коэффициентов при регрессорах [2, 3].
Данный тест можно проводить несколькими способами в GRETL, рассмотрим каждый из них на примере рассматриваемой модели.
Сформулируем гипотезу о совместной незначимости регрессоров , .
не так
Результаты оценивания регрессии без ограничения приведены на рис. 5.1, сумма квадратов остатков данной модели .
Рис. 5.1
Оценим регрессию с ограничением, то есть исключим из нее переменные с коэффициентами, подозрительными на совместную незначимость. Для этого можно, очевидно, по новой оценить модель, но можно и в существующей модели выбрать пункт меню Правка – Изменить модель и удалить регрессоры с коэффициентами, подозрительными на совместную незначимость. Результат оценивания модели с ограничением представлен на рис. 5.2.
Сумма квадратов остатков в модели с ограничением .
Далее рассчитаем значение F-статистики:
Критическое значение статистики составляет , таким образом, , гипотеза о совместной незначимости коэффициентов при этих регрессорах на 5 %-ном уровне значимости принимается. Оба регрессора могут быть исключены из модели, и тогда окончательной спецификацией будет модель с ограничением: