В предыдущих главах была изучена классическая линейная модель регрессии, приведена оценка параметров модели и проверка статистических гипотез о регрессии. Однако мы не касались некоторых проблем, связанных с практическим использованием модели множественной регрессии. К их числу относятся мультиколлинеарность, ее причины и методы устранения использование фиктивных переменных при включении в регрессионную модель качественных объясняющих переменных, линеаризация модели, вопросы частной корреляции между переменными. Изучению указанных проблем посвящена данная глава. [c.108]
До сих пор мы рассматривали линейные регрессионные модели, в которых переменные имели первую степень (модели, линейные по переменным), а параметры выступали в виде коэффициентов при этих переменных (модели, линейные по параметрам). Однако соотношение между социально-экономическими явлениями и процессами далеко не всегда можно выразить линейными функциями, так как при этом могут возникать неоправданно большие ошибки. [c.124]
Модель подсчета баллов является линейной регрессионной моделью. Имеется набор переменных, от которых зависит кредитоспособность данного покупателя. Каждой переменной соответствует вес, определяющий количество баллов в итоговой оценке. Как правило, чем больше баллов, тем выше кредитоспособность заемщика. Баллы разделены на классы, имеющие рекомендованные решения. Например, если общее количество баллов изменяется от 0 до 100 и большее количество баллов означает более высокую кредитоспособность, то если покупатель набрал более 75 баллов, то кредит предоставляется, менее 50 баллов — кредит не предоставляется, а если от 50 до 75, то данные передаются аналитику для последующих исследований. Такая организация процедуры анализа способствует эффективному использованию времени работников кредитного отдела, позволяя им сконцентрировать внимание на случаях, требующих более детального рассмотрения. [c.354]
Другим важным направлением использования статистики Фишера является проверка гипотезы о равенстве нулю не всех коэффициентов регрессии одновременно, а только некоторой части этих коэффициентов. Данное использование статистики F позволяет оценить обоснованность исключения или добавления в уравнение регрессии некоторых наборов объясняющих переменных, что особенно важно при совершенствовании линейной регрессионной модели. [c.159]
Распределение Фишера может быть использовано не только для проверки гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии, но и гипотезы о равенстве нулю части этих коэффициентов. Это особенно важно при развитии линейной регрессионной модели, так как позволяет оценить обоснованность исключения отдельных переменных или их групп из числа объясняющих переменных, или же, наоборот, включения их в это число. [c.318]
В предыдущих главах были рассмотрены модели парной и множественной линейной регрессии, а также задачи экономического анализа, решаемые с помощью этих моделей. Однако далеко не все задачи исследования взаимосвязей экономических переменных описываются обычной линейной регрессионной моделью. Во-первых, исходные данные могут не соответствовать тем или иным предпосылкам линейной регрессионной модели и требовать либо дополнительной обработки, либо иного модельного инструментария Во-вторых, исследуемый процесс во многих случаях описывается не одним уравнением, а системой, где одни и те же переменные могут быть в одних случаях объясняющими, а в других - зависимыми. В-третьих, исследуемые взаимосвязи могут быть (и обычно являются) нелинейными, а процедура линеаризации не всегда легко осуществима и может приводить к искажениям. В-четвертых, структура описываемого процесса может обусловливать наличие различного рода связей между оцениваемыми коэффициентами регрессии, что также предполагает необходимость использования специальных методов. Настоящая глава посвящена обзору ситуаций, требующих выхода за рамки стандартной модели линейной регрессии, и подходов к их исследованию. [c.353]
Если проверка остатков выявит, что лежащие в основе регрессионной модели допущения не выполняются, то исследователь может преобразовать переменные таким образом, чтобы эти предположения выполнялись. Такие преобразования, как логарифмирование, извлечение квадратного корня или вычисление обратных величин, могут стабилизировать дисперсию, сделать распределение нормальным и зависимость линейной. В дальнейшем мы проиллюстрируем применение множественной регрессии на примере. [c.666]
Сравнивая два способа решения систем (8.60) (непосредственно с матрицей X и с переходом к системе нормальных уравнений), можно сделать вывод, что несогласованные системы (8.60), как правило, лучше решать, используя переход к нормальной системе уравнений. В статистической практике несогласованные системы возникают, когда матрица данных X переопределена, т. е. число объектов (столбцов) в ней больше числа переменных (строк), и при этом линейные уравнения, входящие в систему (8.60), не могут выполняться точно. Но превышение числа объектов над числом переменных — типичная ситуация в регрессионном анализе. Второе условие несогласованности также часто выполняется, так как обычно системы линейных уравнений используются для оценки параметров линейных моделей типа (8.1), являющихся лишь приближением действительных соотношений между переменными (мерой этого приближения как раз и является дисперсия случайной компоненты е). Для обоснования перехода к нормальной системе уравнений существенно и то, что матрица Х Х тесно связана с ковариационной матрицей, которая является исходным объектом для различных видов многомерного анализа (главных компонент, факторного анализа и т. д.). [c.275]
Наиболее распространенным в практике статистического оценивания параметров уравнений регрессии является метод наименьших квадратов. Этот метод основан на ряде предпосылок относительно природы данных и результатов построения модели. Основные из них - это четкое разделение исходных переменных на зависимые и независимые, некоррелированность факторов, входящих в уравнения, линейность связи, отсутствие автокорреляции остатков, равенство их математических ожиданий нулю и постоянная дисперсия. Эмпирические данные не всегда обладают такими характеристиками, т.е. предпосылки МНК нарушаются. Применение этого метода в чистом виде может привести к таким нежелательным результатам, как смещение оцениваемых параметров, снижение их состоятельности, устойчивости, а в некоторых случаях может и вовсе не дать решения. Для смягчения нежелательных эффектов при построении регрессионных уравнений, повышения адекватности моделей существует ряд усовершенствований МНК, которые применяются для данных нестандартной природы. [c.353]
Рассмотрим вопрос о регрессии. В ряде случаев именно от его решения — оценки уравнений регрессии — зависят оценки тесноты связи, а они, в свою очередь, дополняют результаты регрессионного анализа. Прежде всего следует определить перечень независимых переменных X, включаемых в уравнение. Это должно делаться на основе теоретических положений. Список X может быть достаточно широк и ограничен только исходной информацией. На практике теоретические положения о сути взаимосвязи подкрепляются парными коэффициентами корреляции между зависимой и независимыми переменными. Отбор наиболее значимых из них можно провести с помощью ЭВМ, выбирая в соответствии с коэффициентами корреляции и другими критериями факторы, наиболее тесно связанные с У. Параллельно решается вопрос о форме уравнения. Современные средства вычислительной техники позволяют за относительно короткое время рассчитать достаточно много вариантов уравнений. В ЭВМ вводятся значения зависимой переменной У и матрица независимых переменных X, принимается форма уравнения, например линейная. Ставится задача включить в уравнение k наиболее значимых X. В результате получим уравнение регрессии с k наиболее значимыми факторами. Аналогично можно выбрать наилучшую форму связи. Этот традиционный прием, называемый пошаговой регрессией, если он не противоречит качественным посылкам, достигает приемлемых результатов. Первоначально обычно берется линейная модель множественной регрессии [c.134]
Шестая часть посвящена оценкам максимального правдоподобия, которые, конечно, являются идеальным объектом для демонстрации мощи развиваемой техники. В первых трех главах исследуется несколько моделей, среди которых есть многомерное нормальное распределение, модель с ошибками в переменных и нелинейная регрессионная модель. Рассматриваются методы работы с симметрией и положительной определенностью, специальное внимание уделено информационной матрице. Вторая глава этой части содержит обсуждение одновременных уравнений при условии нормальности ошибок. В ней рассматриваются проблемы оценивания и идентифицируемости параметров при различных (не)линейных ограничениях на параметры. В этой части рассматривается также метод максимального правдоподобия с полной информацией (FIML) и метод максимального правдоподобия с ограниченной информацией (LIML), особое внимание уделено выводу асимптотических ковариационных матриц. Последняя глава посвящена различным проблемам и методам психометрики, в том числе методу главных компонент, мультимодальному компо- [c.16]
Вторую часть книги, посвященную методам среднесрочного про нозирования, открывает гл. 7, где описывается теория линейной грессии (в случае, когда независимой переменной служит врем этот раздел называется иногда анализом трендов). В гл, 8 рассказ вается, как некоторым преобразованием одной или двух переменны] (зависимой или независимой переменной — время) выравнивание линейной регрессионной модели распространяется на некоторый кла криволинейных зависимостей. В гл, 9 описываются методы подгонк кривых, основанных на модифицированной экспоненте и не сводящи ся к линейной регрессии. Наконец, в последней главе обсуждается пр менение специального метода среднесрочного прогнозирования, из вестного под названием метод кумулятивных сумм — метод корре ции среднесрочных прогнозов. [c.76]
Многие специалисты определяют задачи Э. как формализованное описание и прогнозирование экономии, процессов на основе статистич. анализа данных и ограничивают Э. разработкой и применением аналитич. моделей, причём иногда по традиции — лишь аналити-ко-статистич. (регрессионных) моделей. Однако с 30-х гг. наряду с ними возник др. класс моделей — нормативных. Эти модели позволяют не только рассчитывать варианты структуры и динамики экономич. объектов, но и по определ. критерию оценки выбрать наилучший (оптимальный) вариант. Значит, вклад в их разработку был сделан сов. учёным Л. В. Канторовичем — создателем линейного программирования (1939), что дало возможность ему, В. В. Новожилову, А. Л. Лурье (СССР), Т. Купмансу, Дж. Данцигу (США) и др. сформулировать и решить широкий спектр экономич. задач оптим. распределения и использования ресурсов. Дальнейшее развитие методов оптимизации привело к разработке различных типов нормативных моделей (большое влияние здесь оказали работы Дж. Неймана). В зависимости от характера переменных и формы связей между ними модели могут быть линейными и нелинейными, непрерывными и дискретными, детерминированными и стохастическими и т. д. Их особенностями определяется применение соответствующих методов математического программирования, исследования операций, теории игр. В социалистич. странах нормативные модели широко используются при оптимизации нар.-хоз. планирования на всех его уровнях (напр., работы Н. Н. Некрасова и Н. П. Федоренко в области химизации и развития химич. пром-сти в СССР). В капиталистич. странах методы оптимизации применяются в рамках отд. фирм, а также при разработке гос. программ. В СССР и др. социалистич. странах широко изучается внутр. связь нормативных и аналитич. моделей, создаются комплексы моделей, включающие оба эти типа, разрабатываются их научно-теоретич. основы. Тем самым расширяется круг проблем Э. [c.434]
Одним из условий классической регрессионной модели является предположение о линейной независимости объясняющих переменных, что означает линейную независимость столбцов матрицы регрессоров X или (эквивалентно) что матрица (Х Х) 1 имеет полный ранг k. При нарушении этого условия, т. е. когда один из столбцов матрицы X есть линейная комбинация остальных столбцов, говорят, что имеет место полная коллинеарность. В этой ситуации нельзя построить МНК-оценку параметра (3, что формально следует из сингулярности матрицы X X и невозможности решить нормальные уравнения. Нетрудно также понять и содержательный смысл этого явления. Рассмотрим следующий простой пример регрессии (Greene, 1997) С = fa + faS + foN + /34Т + е, где С — потребление, S — зарплата, N — доход, получаемый вне работы, Т — полный доход. Поскольку выполнено равенство Т = S + N, то для произвольного числа h исходную регрессию можно переписать в следующем виде С = (3i+/3 2S+/3 3iN+/3 4T-1r , где / 2 = 02 + h, /% = Рз + h, /3 4 = 04 — h. Таким образом, одни и те же наблюдения могут быть объяснены различными наборами коэффициентов /3. Эта ситуация тесно связана с проблемой идентифицируемости системы, о чем более подробно будет говориться позднее. Кроме того, если с учетом равенства Т — S + N переписать исходную систему в виде С = fa + (/% + 0 )S + (/Зз + /3 )N + е, то становится ясно, что оценить можно лишь три параметра fa, (Дз + Д ) и (/ 3 + /3[c.109]
Поскольку к моменту появления теоретических моделей распределения налогового бремени, вычислительные мощности не позволяли строить большие эмпирические модели общего равновесия, делались попытки проверки выводов теоретических моделей на основе регрессионного анализа. Подобный подход к исследованию перемещения налогового бремени используется, в частности, в работе Krzyzaniak, Musgrave (1963). В этой работе исследуется зависимость посленалоговой доходности капитала от отношения налоговых обязательств корпоративного сектора к объему капитала, а также от эффективной ставки налогообложения прибыли. Авторы проводили оценку линейной регрессии методом инструментальных переменных, в которой отношение налоговых обязательств к объему капитала использовалось как объясняющая переменная, а эффективная ставка налогообложения прибыли - в качестве инструмента. Соответствующий коэффициент при эффективной ставке в указанной зависимости, полученный авторами, при оценке на интервале 1935-1959 гг. оказался равным 1,43. Таким образом, бремя налогообложения капитала более чем полностью перемещено, т.е. владельцы капитала фактически выигрывают, получая больший доход вследствие роста ставки налогообложения прибыли. [c.86]