Ошибки в измерении независимой переменной. Ситуация радикальным образом меняется в худшую сторону, когда есть ошибки в измерении регрессоров. Пусть, как и раньше, истинной является модель (8.1), но наблюдается матрица X — X + V, где матрица ошибок V имеет нулевое математическое ожидание и не зависит [c.214]
Понятно, что можно рассматривать общий случай, когда есть ошибки в измерениях независимых и зависимых переменных. Ясно, что, как и в предыдущем случае, применение метода наименьших квадратов будет приводить к смещенным и несостоятельным оценкам. [c.215]
А, С не выполняется. Например, эти условия не выполняются, если в i -м уравнении какая-нибудь из объясняющих переменных коррелирована с ошибкой в этом уравнении. Последнее характерно для моделей с ошибками в измерении объясняющих переменных и для моделей "одновременных уравнений", о которых мы будем говорить ниже. Пока же приведем пример, показывающий, к каким последствиям приводит нарушение условия некоррелированности объясняющих переменных с ошибками. [c.106]
Модели с ошибками в измерении объясняющих переменных [c.111]
Стохастические связи между различными явлениями и их признаками в отличие от функциональных, жестко детерминированных, характеризуются тем, что результативный признак (зависимая переменная) испытывает влияние не только рассматриваемых независимых факторов, но и подвергается влиянию ряда случайных (неконтролируемых) факторов. Причем полный перечень факторов не известен, так же как и точный механизм их воздействия на результативный признак. В этих условиях значения зависимой переменной тоже не могут быть измерены точно. Их можно определить с определенной вероятностью, поскольку они подвержены случайному разбросу и содержат неизбежные ошибки измерения переменных. [c.69]
В дальнейшем используются следующие обозначения Xt, xt, Zt, ztr q, v — зависимая и независимая переменные при отсутствии и наличии ошибок измерения, ошибки измерения в этих переменных и 1 ы<2> d2> — остаточные возмущения и белый шум в уравнениях для временных рядов и для временных рядов перекрестных выборок М, s2, л(1>, я(2), 2W, 2(2) — математическое ожидание, выборочная дисперсия, остаточные ковариационные матрицы и ковариационные матрицы коэффициентов в уравнениях для временных рядов и временных рядов перекрестных выборок N(0, s2), гг, Т, п, К, Е, i, ML — обозначение нормального распределения, коэффициент остаточной марковской автокорреляции первого порядка, количество наблюдений временного ряда и выборочного обследования, число независимых переменных, единичная матрица и единичный вектор, обозначение оценки наибольшего правдоподобия. [c.73]
До сих пор мы безоговорочно предполагали, что переменные X измерены без ошибок и что единственной допустимой формой ошибок в рассматриваемом соотношении могут быть возмущения и. Последнее было продиктовано стремлением учесть воздействие различных объясняющих переменных, не включенных явно в это соотношение. Можно, конечно, ввести составляющую, которая отражает ошибку измерения зависимой переменной Y, и не нарушить все полученные ранее результаты. Выясним теперь, к чему приведет предположение о наличии ошибки измерения у переменных X. Мы предполагаем, что р есть вектор коэффициентов, полученных для точно измеренных значений переменных X. Что произойдет, если воспользоваться нашей техникой наименьших квадратов в применении к имеющимся в наличии реальным измерениям переменных X и переменной У Ответ на этот вопрос таков оценки, полученные обыкновенным методом наименьших квадратов, будут не только смещенными, но и несостоятельными. Это можно продемонстрировать следующим образом. [c.280]
Даже в том случае, когда ошибки измерения переменных X не коррелируют с истинными значениями этих переменных и первое слагаемое в правой части этого выражения равно нулю, второе слагаемое, которое представляет собой матрицу ковариаций ошибок измерения, в силу нашего предыдущего предположения, в нуль не обращается. Итак, оценки, найденные обыкновенным методом наименьших квадратов, несостоятельны и их асимптотическое смещение определяется формулой [c.281]
Ошибки измерения показателей, принятых в качестве аргументов, должны быть ничтожно малы по сравнению с ошибками измерения зависимой переменной. [c.66]
Систематические ошибки измерения объясняющих переменных — одна из возможных причин того, что эконометрическая модель не является регрессионной. В экономических исследованиях подобная ситуация встречается достаточно часто. Одним из возможных путей устранения этого, как правило, довольно неприятного обстоятельства, является выбор других объясняющих переменных (эти вопросы рассматриваются в гл. 8 настоящего учебника). [c.13]
Голландским инвестиционным банком была разработана и использовалась реальная качественная база данных для оценки будущего состояния дел его корпоративных клиентов. Из-за того, что целевая переменная определялась задним числом, данные не позволяли исследовать ошибки 2-го рода. При помощи нелинейного анализа главных компонент первоначальное количество переменных (49) было уменьшено до 19 переменных, которые располагались в трех измерениях. В связи с тем, что, как выяснилось, около 60% исходных переменных несущественны для принятия решения, банк в настоящее время подумывает о том, чтобы изменить способ оценки. Как вариант рассматривается двухступенчатая процедура, в которой клиент сначала проходит сканирование по 19 переменным, а в случае успеха включаются в работу 30 новых переменных. Благодаря такому двухъярусному методу будут высвобождены значительные управленческие ресурсы банка. Малая степень значимости пяти финансовых показателей в полученном трехмерном пространстве может быть связана с тем, что в исследуемой выборке были представлены только жизнеспособные компании. [c.195]
Пример. В табл. 5.4 представлены численные ошибки для нескольких разностных формул, использованных для вычисления температурного градиента в стенке (dT/dz)z0 по измеренным значениям температуры, которая считалась детерминированной переменной. [c.217]
В экономико-математическом моделировании (в вероятностных моделях, экономико-статистических моделях) В. отражается стохастическим членом модели, который называется "ошибкой", "вектором помех", а также "остатком". Этот член, во-первых, улавливает неучтенные моделью факторы, поскольку в модель можно включать лишь ограниченное число существенных переменных (хотя эффект каждого из неучтенных факторов — иначе он был бы признан существенным — невелик, в сумме они оказывают определенное воздействие на выходы модели) во-вторых, он включает непредсказуемый элемент случайности человеческих поступков и реакций и в-третьих, ошибки измерения или наблюдения, следствия неточности информации, имеющейся при разработке модели. [c.52]
Из (1.14), в частности, следует, что коэффициент корреляции признаков, на которые наложены ошибки измерения, всегда меньше по абсолютной величине, чем коэффициент корреляции исходных признаков. Другими словами, ошибки измерения всегда ослабляют исследуемую корреляционную связь между исходными переменными, и это искажение тем меньше, чем меньше отношения дисперсий ошибок к дисперсиям самих исходных переменных. Формула (1.14) позволяет скорректировать искаженное значение коэффициента корреляции для этого нужно либо знать разрешающие характеристики измерительных приборов (и, следовательно, величины дисперсий ошибок а и а ), либо провести дополнительное исследование по их выявлению. [c.73]
Если рассмотреть зависимость одной из характеристик системы T V(X/), как функцию только одной переменной х/, (рис. 7.2), то при фиксированных значениях xt будем получать различные значения тЦх,). Разброс значений т в данном случае определяется не только ошибками измерения, а главным образом влиянием помех z,. Сложность задачи оптимального управления характеризуется не только сложностью самой зависимости Т У( Ь 2> > )> но и влиянием z,, [c.243]
Таким образом, экспертные оценки значений наблюдаемых переменных допустимы, но в быту, а не в науке, не в процедурах принятия решений. Они допустимы в тех случаях, когда требования к точности и надежности измерений невысоки, когда цена ошибки незначительна. В научных исследованиях, в практике анализа, прогнозирования и планирования социальных, экономических, экологических, технических, биологических и т. п. систем использование экспертных оценок совершенно недопустимо. [c.132]
Изучение зависимостей экономических переменных начнем со случая двух переменных (обозначим их х и у). Этот случай наиболее прост и может быть рассмотрен графически. Предположим, что имеются ряды значений переменных, соответствующие им точки нанесены на график и соединены линией. Если это реальные статистические данные, то мы никогда не получим простую линию - линейную, квадратичную, экспоненциальную и т.д. Всегда будут присутствовать отклонения зависимой переменной, вызванные ошибками измерения, влиянием неучтенных величин или случайных факторов. Но если мы не получили, например, точную прямую линию, это еще не значит, что в основе рассматриваемой зависимости лежит нелинейная функция. Возможно, зависимость переменных линейна, и лишь случайные факторы приводят к некоторым отклонениям от нее. То же самое можно сказать и про любой другой вид функции. Связь переменных, на которую накладываются воздействия случайных факторов, называется статистической связью. Наличие такой связи заключается в том, что изменение одной переменной приводят к изменению математического ожидания другой пе- [c.293]
Рассмотрим теперь задачу оценки коэффициентов парной линейной регрессии более формально. Предположим, что связь между х и у линейна у = а+рх. Здесь имеется в виду связь между всеми возможными значениями величин х и у, то есть для генеральной совокупности. Наличие случайных отклонений, вызванных воздействием на переменную у множества других, неучтенных в нашем уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин х( и j/ приобретет вид yt = а. + РХ + е(. Здесь е - случайные ошибки (отклонения, возмущения). Задача состоит в следующем по имеющимся данным наблюдений х , (у) оценить значения параметров айв, обеспечивающие минимум величины Q. Если бы были известны точные значения отклонений е(, то можно было бы (в случае правильности предполагаемой линейной формулы) рассчитать значения параметров аир. Однако значения случайных отклонений в выборке неизвестны, и по наблюдениям х и у, можно получить оценки параметров аир, которые сами являются случайными величинами, поскольку соответствуют случайной выборке. Пусть а - оценка параметра а, Ь - оценка параметра р. Тогда оцененное уравнение регрессии будет иметь вид y=a+bx+et, где е - наблюдаемые значения ошибок е. [c.296]
По-видимому, нереалистично рассматривать ошибку измерения ственную только одной переменной. Поэтому в гл. 9 мы pep проблеме ошибок измерения, а до этого сконцентрируем вним. ошибках уравнения. [c.20]
В предыдущем параграфе мы видели, как в соответствующих условиях инструментальные переменные позволяют получить состоятельные оценки. Из (9.41) ясно, что, найдя матрицу Z инструментальных переменных, некоррелированных в пределе как с возмущением и, так и с ошибками измерения V, мы получим состоятельную оценку вектора [c.282]
Классическое решение подобной задали состоит в предположении, что имеется некоторая дополнительная информация. Как правило, считают известным и постоянным отношение дисперсий ошибок и и и. Такое решение не кажется нам удовлетворительным с эконометриче-ской точки зрения, поскольку переменная и, вообще говоря, содержит две составляющие — ошибку -измерения переменной Y и стохастическое возмущение. И если можно рассчитывать на какой-то шанс при попытке оценить ошибку измерения величины Y, то у "нас нет никакой надежды определить заранее величину дисперсии возмущающего воздействия. В самом деле, оценка качества подгонки соотношения к исходной статистической информации есть одна из непосредственных целей эконометрического анализа. Классический подход к решению этой задачи основан на предположении, что существует точная связь между истинными значениями У и X, так что и отражает только ошибку измерения величины Y. Единственный выход в нашем случае — гипотеза о том, что дисперсия ошибки измерения объясняющей переменной известна. Такое предположение для многих конкретных ситуаций оказывается вполне приемлемым. Так, становится все более принятым публиковать статистические данные о национальном доходе с указанием вероятного уровня ошибок. Пусть, например, наблюдаемые значения переменной X имеют среднее, равное 100, и мы утверждаем, что максимальная ошибка каждого значения с очень малой вероятностью превосходит 10%. Мы можем тогда положить Зсг = 10 и о = 11. [c.286]
Регрессионная зависимость случайного результирующего показателя г) от неслучайных предсказывающих переменных X (схема В). Природа такой связи может носить двойственный характер а) регистрация результирующего показателя г неизбежно связана с некоторыми случайными ошибками измерения е, в то время как предикторные (объясняющие) переменные X = (х(1) лс(2),. .., х(р ) измеряются без ошибок (или величины этих ошибок пренебрежимо малы по сравнению с со-ответствукмвдми ошибками измерения результирующего показателя) б) значения результирующего показателя г) зависят не только от соответствующих значений X, но и еще от [c.35]
Отрицательные знаки коэффициентов регрессии соответствуют здесь теоретическим представлениям. Коэффициент при переменной GNPзначительно меньше по абсолютной величине, чем коэффициент при RSR, но это не значит, что данная величина воздействует на зависимую переменную слабее. Здесь все определяется единицами измерения, и если ВНП измерять не в миллиардах, а в триллионах долларов, то соответствующий коэффициент регрессии будет равен не 0,017, а 17, при стандартной ошибке 4. [c.336]
В предыдущих разделах предполагалось, что независимые переменные (матрица X) являются неслучайными. Ясно, что такое условие выполнено не всегда, например, во многих ситуациях при измерении независимых переменных могут возникать случайные ошибки. Кроме того, при анализе временных рядов значение исследуемой величины в момент t может зависеть от ее значений в предыдущие моменты времени, т. е. в некоторых уравнениях эти значения выступают в качестве независимых, а в других — в качестве зависимых переменных (модели с лагированными переменными). Поэтому возникает необходимость рассматривать модели со стохастическими регрессорами. [c.149]
В строгом смысле регрессионная модель требует, чтобы ошибки измерения были связаны только с критериальной переменной и чтобы предикторы были измерены ошибок. Что касается сериально коррелированных см. статью Eugene anjels, Mark W. [c.682]
На практике редко встречается ситуация, когда матрица М вырождена. Более распространен случай, когда она плохо обусловлена (между переменными Z существуют зависимости близкие к линейным). В этом случае имеет место мультиколлинеарность факторов. Поскольку гипотеза 2 в части отсутствия ошибок измерения, как правило, нарушается, получаемые (при мультиколлинеарности) оценки в значительной степени обусловлены этими ошибками измерения. В таком случае (если связь существует), обычно, факторы по отдельности оказываются незначимыми по t-критерию, а все вместе существенными по F-критерию. Поэтому в регрессию стараются не вводить факторы сильно скоррелированные с остальными. [c.23]
Третьим источником ошибок являются ошибки наблюдения и мерения. Точная линейная зависимость Z = а + (ЗХ переменно X может оказаться скрытой в результате того, что вместо H TI значения Z мы будем наблюдать величину Y = Z + и, где и — о измерения. Тогда мы имеем [c.20]
Ошибки измерения в переменных X создают серьезные трудности оценивания, преодоление которых требует альтернативных методов. В литературе описано два основных типа таких методов один основан на использовании разного рода инструментальных переменных, а другой— на принципе максимума правдо.подобия, применение-которого сопровождается довольно строгими предположениями относительно матрицы ковариаций ошибок измерения. Прежде чем перейти к описанию таких методов оценивания, необходимо указать на сущестзен- [c.281]