Коэффициент корреляции находит применение и при характеристике линии регрессии, которая исчисляется для совокупности выборочных наблюдений методом наименьших квадратов. В том случае, когда линия регрессии повышается слева направо и тесно согласуется с наблюдениями, коэффициент имеет высокое положительное значение при понижении линии регрессии слева направо и тесном согласовании с наблюдениями коэффициент корреляции имеет высокое отрицательное значение. [c.312]
Теперь обратимся к выборочным данным о расходах, собранным путем выборочного опроса части жителей городка. Считая выборку репрезентативной, предположим, для простоты, она включает по одному человеку из каждой группы дохода. Отображая выборочные точки на графике, мы можем провести через них линию регрессии, соответствующую уравнению Y = а + ЬX, коэффициенты а и b в котором рассчитываются по обычным формулам линейной регрессии. Если учесть, что наблюдаемые значения К. не лежат на линии регрессии (a+bXt), то в это уравнение надо добавить выборочные случайные возмущения е (ek = Yk-a-bX , являющиеся аналогами случайных возмущений в генеральной совокупности [c.306]
Он характеризует долю вариации (разброса) зависимой переменной, объясненной с помощью данного уравнения. В качестве меры разброса зависимой переменной обычно используется ее дисперсия, а остаточная вариация может быть измерена как дисперсия отклонений вокруг линии регрессии. Если числитель и знаменатель вычитаемой из единицы дроби разделить на число наблюдений л, то получим, соответственно, выборочные оценки остаточной дисперсии и дисперсии зависимой переменной . Отношение остаточной и общей дисперсий представляет собой долю необъясненной дисперсии. Если же эту долю вычесть из единицы, то получим долю дисперсии зависимой переменной, объясненной с помощью регрессии. Иногда при расчете коэффициента детерминации для получения несмещенных оценок дисперсии в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы тогда [c.313]
Jf KXY vs x значит, прямая линия регрессии имеет уравнение у= У+(х— X )Kxv s2x Через KXy s2x обозначаем выборочные аналоги корреляционного момента случайной величины X, У и дисперсии соответственно. [c.136]
В силу того, что оценивание параметров уравнения (6.6.11) осуществляется по выборочным данным, оценки а и b содержат некоторую погрешность. Причем, погрешность в значении а приводит к вертикальному сдвигу линии регрессии, а колеблемость оценки Ь, связанная с ее выборочным происхождением — к покачиванию линии регрессии. Тогда дисперсия значения зависимой переменной у , обозначим ее 5>(2, будет складываться из двух компонент — дисперсии параметра а и дисперсии параметра Ь. Ее выражение имеет вид [c.426]
Требуется по полученным данным найти выборочное уравнение прямой линии средней квадратической регрессии [c.143]
Из рис. 16.8 видно, что выборочные линии регрессии имеют разный наклон и разные точки пересечения с осью У для различных выборок. Более того, при положительном наклоне генеральной регрессии наклон выборочной линии регрессии может оказаться для некоторых выборок отрицательным, что, однако, не будет свидетельствовать об истинной отрицательной связи исследуемых величин. Для того чтобы убедиться в этомт следует помимачюэффици-ентов регрессии находить их стандартные отклонения и f-статисти-ки, по которым можно судить о статистической значимости полученных выборочных коэффициентов регрессии. [c.307]
Для точного описания уравнения регрессии необходимо знать условный закон распределения зависимой переменной Y при условии, что переменная X примет значение дс, т. е. Х=х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений (х/, у,) ограниченного объема п. В этом случае речь может идти об оценке (приближенном выражении, аппроксимаций) по выборке функции регрессии. Такой оценкой1 является выборочная линия (кривая) регрессии [c.52]
Реальная трудность применения рассмотренного метода состоит в отыскании переменных, пригодных для роли инструментальных. Истинное распределение ненаблюдаемо и поэтому трудно быть уверенным в том, что выбранные инструментальные переменные действительно не коррелируют в пределе с возмущениями. С другой стороны, эти переменные должны обладать довольно высокой корреляцией с переменными X, иначе выборочные дисперсии для оценок, полученных с помощью инструментальных переменных, могут оказаться чрезмерно большими. Например, в случае единственной объясняющей переменной оценка коэффициента наклона линии регрессии, найденная с помощью инструментальной переменной, будет равна [c.279]
Использованный метод поиска коэффициентов avtj3 называется методом наименьших квадратов. Сравнивая коэффициенты а и J3 с полученными в предыдущем параграфе выборочными коэффициентами линейной регрессии видим, что они совпадают. Следовательно, утверждение о том, что коэффициенты линейной регрессии 7 на X определяют такую прямую линию, что сумма квадратов отклонений величины 7 от этой прямой имеет минимальное значение, по сравнению с суммой квадратов отклонений величины 7 от любой другой прямой, доказано. [c.100]