Л=Ро+М 1+- + Мф+е.-> = , .., л (5.1) для каждого уровня качественного признака (т. е. выборочное уравнение регрессии отдельно для работников-мужчин и отдельно — для женщин), а затем изучать различия между ними (см. 5.4). [c.116]
Отсюда выборочное уравнение регрессии будет иметь вид [c.168]
Выборочные уравнения регрессии [c.142]
Уравнение (5.4) определяет выборочное уравнение регрессии у на х. Сама функция J (x) называется выборочной регрессией Y на X, а график J (x) — выборочной регрессией. Аналогично определяется для случайных величин X [c.142]
Затем по формулам (3.7)— (3.15) находим выборочные характеристики и параметры уравнений регрессии [c.55]
Найдем дисперсию групповой средней у, представляющей выборочную оценку M Y). С этой целью уравнение регрессии (3.12) представим в виде [c.64]
Оценим условное математическое ожидание Mx=g(Y). Выборочной оценкой MX=S( ) является групповая средняя j>x=8, которую найдем по уравнению регрессии [c.68]
Зная вектор Ь, выборочное уравнение множественной регрессии представим в виде [c.87]
Решение. По формуле (4.8) найдем вектор оценок параметров регрессионной модели b =(3,515 —0,006 15,542 60,110 4,475 —2,932), так что в соответствии с (4.9) выборочной уравнение множественной регрессии имеет вид [c.113]
Так что в соответствии с (4.9) выборочное уравнение множественной регрессии примет вид [c.120]
Так как параметры линейной регрессии зависимы между собой (b = Y — a-X ), то уравнение регрессии можно переписать в виде f = ax + b = a-(x — X + Y. Каждая точка на линии регрессии выражается через выборочные значения (а, 7), [c.120]
Регрессионное уравнение не дает точного прогноза зависимой переменной для любого заданного значения независимой переменной, так как коэффициенты регрессии подвержены случайным искажениям. Чтобы учесть погрешности оцененного уравнения регрессии, отражающего действительные закономерности поведения всего населения на основе выборочного наблюдения, уравнение регрессии обычно записывается как [c.5]
Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики. [c.36]
В связи с тем, что в реальности всегда существуют неуправляемые и неконтролируемые возмущения, изменение Y носит случайный характер, поэтому при обработке экспериментальных данных вместо точных значений а,, ац ау . . . получаются так называемые выборочные коэффициенты регрессии, являющиеся оценками теоретических коэффициентов. Уравнение регрессии, получаемое на основании опыта, имеет ту же структуру [c.221]
Вид графа непосредственных связей говорит о том, что при построении уравнения регрессии только по двум факторам — количеству тралений и времени чистого траления— остаточная дисперсия ст .з4 не отличалась бы от остаточной дисперсии а .23456. полученной из уравнения регрессии, построенного по всем факторам. Чтобы оценить различие, мы обратимся в данном случае к выборочной оценке. 1.23456 = 0,907, а 1.34 = 0,877. Но если скорректировать коэффициенты по формуле (38), то 1.23456=0,867, a / i.34= = 0,864. Различие вряд ли можно считать существенным. Более того, г14 = 0,870. Это наводит на мысль, что количество тралений почти не оказывает непосредственного влияния на размер улова. Действительно, в стандартизованном масштабе 1.34 = 0,891 4 — 0,032 3- Нетрудно убедиться, что коэффициент регрессии при t3 недостоверен даже при очень низком доверительном интервале. [c.187]
Следует отметить, что вычисление и использование выборочных характеристик степени тесноты связи типа (1.21) затруднено по меньшей мере тремя обстоятельствами 1) необходимостью предварительного выбора общего вида регрессионной зависимости 2) необходимостью предварительного вычисления оценок для входящих в уравнение регрессии неизвестных параметров 3) отсутствием строгих рекомендаций по их проверке на статистическую значимость и по построению соответствующих интервальных оценок. [c.81]
Пользуясь результатами эксперимента, можно определить выборочные коэффициенты регрессии bo, bt, by, Ь, которые являются лишь оценками (приближенными значениями) для теоретических коэффициентов регрессии. Уравнение регрессии, полученное на основе опыта, запишется так [c.245]
Требуется по полученным данным найти выборочное уравнение прямой линии средней квадратической регрессии [c.143]
Как связаны эмпирические коэффициенты линейной регрессии с выборочным коэффициентом корреляции между переменными уравнения регрессии [c.107]
Проиллюстрируем связь между коэффициентом детерминации R для парного уравнения регрессии и выборочным коэффициентом корреляции гху. [c.134]
Здесь (k - m - 1) - число степеней свободы соответствующих выборочных дисперсий (т - количество объясняющих переменных в уравнении регрессии). [c.218]
Если случайные отклонения уравнения регрессии удовлетворяют предпосылкам МНК, то ошибка предсказания At+p будет иметь нулевое математическое ожидание и минимальную дисперсию. При этом в случае парной регрессии (12.44) выборочная дисперсия определяется по формуле [c.294]
Для практического применения обобщенного метода наименьших квадратов следует оценить матрицу . Это можно сделать, применив метод наименьших квадратов сначала к уравнениям (9.18), (9.19) по отдельности, найти остатки регрессии и принять в качестве оценок матриц Z/, выборочные ковариации 6v(e,,e7). Очевидно, эти оценки будут состоятельными. [c.237]
Коэффициенты регрессии, найденные исходя из системы нормальных уравнений, представляют собой выборочные оценки характеристики силы связи. Их несмещенность является желательным свойством, так как только в этом случае они могут иметь практическую значимость. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Следовательно, при большом числе выборочных оцениваний остатки не будут накапливаться и найденный параметр регрессии bt можно рассматривать как среднее значение из возможного большого количества несмещенных оценок. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям. [c.156]
Этап 7 (анализ точности полученных уравнений связи). Исследователь должен отдавать себе отчет в том, что найденная им в соответствии с (В.24) аппроксимация f (X) неизвестной теоретической функции fT (X) из соотношений типа (В. 14), (В. 16) или (В.21) (называемая эмпирической функцией регрессии, см. гл. 5) является лишь некоторым приближением истинной зависимости fT (X)1. При этом погрешность в описании неизвестной истинной функции fT (X) с помощью f (X) в общем случае состоит из двух составляющих а) ошибки аппроксимации 6F и б) ошибки выборки б (/г). Величина первой зависит от успеха в реализации этапа 4, т. е. от правильности выбора класса допустимых решений F. В частности, если класс F выбран таким образом, что включает в себя и неизвестную истинную функцию f (т. е. fT (X) F), то ошибка аппроксимации 6F = 0. Но даже в этом случае остается случайная составляющая (ошибка выборки) б (/г), обусловленная ограниченностью выборочных данных вида (В.1), па основании которых мы подбираем функцию f (X) (оцениваем ее параметры). Очевидно, уменьшить ошибку выборки мы можем за счет увеличения объема п обрабатываемых выборочных данных, так как при fT (X) F (т. е. при 6F — 0) и правильно выбранных методах статистического оценивания (т. е. при правильном выборе оптимизируемого функционала качества модели Дп (/)) ошибка выборки б (/г) -> 0 (по вероятности) при п — оо (свойство состоятельности используемой процедуры статистического оценивания неизвестной функции fT (X)). [c.52]
Последнее определение Я-регрессии удобно для построения оценок (в, , 0J) по выборочным данным. Для этого достаточно в уравнениях (7.38) — (7.40) заменить символ математического ожидания Е на знак суммирования по всем наблюдениям и ре- [c.220]
Теперь обратимся к выборочным данным о расходах, собранным путем выборочного опроса части жителей городка. Считая выборку репрезентативной, предположим, для простоты, она включает по одному человеку из каждой группы дохода. Отображая выборочные точки на графике, мы можем провести через них линию регрессии, соответствующую уравнению Y = а + ЬX, коэффициенты а и b в котором рассчитываются по обычным формулам линейной регрессии. Если учесть, что наблюдаемые значения К. не лежат на линии регрессии (a+bXt), то в это уравнение надо добавить выборочные случайные возмущения е (ek = Yk-a-bX , являющиеся аналогами случайных возмущений в генеральной совокупности [c.306]
Он характеризует долю вариации (разброса) зависимой переменной, объясненной с помощью данного уравнения. В качестве меры разброса зависимой переменной обычно используется ее дисперсия, а остаточная вариация может быть измерена как дисперсия отклонений вокруг линии регрессии. Если числитель и знаменатель вычитаемой из единицы дроби разделить на число наблюдений л, то получим, соответственно, выборочные оценки остаточной дисперсии и дисперсии зависимой переменной . Отношение остаточной и общей дисперсий представляет собой долю необъясненной дисперсии. Если же эту долю вычесть из единицы, то получим долю дисперсии зависимой переменной, объясненной с помощью регрессии. Иногда при расчете коэффициента детерминации для получения несмещенных оценок дисперсии в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы тогда [c.313]
Для простоты рассмотрим случай, когда набор активов У состоит из одного актива (т = 1), и перейдем к выборочному аналогу уравнения (15.23). Тогда, чтобы тестировать гипотезу Но, нам надо оценить коэффициенты регрессии [c.452]
Jf KXY vs x значит, прямая линия регрессии имеет уравнение у= У+(х— X )Kxv s2x Через KXy s2x обозначаем выборочные аналоги корреляционного момента случайной величины X, У и дисперсии соответственно. [c.136]
В силу того, что оценивание параметров уравнения (6.6.11) осуществляется по выборочным данным, оценки а и b содержат некоторую погрешность. Причем, погрешность в значении а приводит к вертикальному сдвигу линии регрессии, а колеблемость оценки Ь, связанная с ее выборочным происхождением — к покачиванию линии регрессии. Тогда дисперсия значения зависимой переменной у , обозначим ее 5>(2, будет складываться из двух компонент — дисперсии параметра а и дисперсии параметра Ь. Ее выражение имеет вид [c.426]
Несмотря на кажущуюся надежность уравнения регрессии для всей выборочной совокупности НГДУ, использовать его для практических целей нельзя, так как проверка на нормальность распределения у показала, что р=1,043 значительно больше табличного значения, что свидетельствует о ненормальном распределении у. Поэтому необходимо рассмотреть вопрос о правомерности использования данной совокупности НГДУ для корреляционного и регрессионного анализа. Для этого проведено попарное сравнение дисперсий о2 отдельных групп НГДУ. [c.88]
Полученные для выборочной совокупности НГДУ уравнения регрессии (20) — (22) могут точно не совпадать с истинной зависимостью, характерной для генеральной совокупности НГДУ. Поэтому необходимо найти доверительный интервал Д, в котором с определенной вероятностью будет находиться расчетная величина производительности труда. Для среднего значения производительности труда у величину доверительного интервала при заданной доверительной вероятности, являющейся минимальной, рассчитывают по формуле [c.89]
Зная величину Эу для каждого фактора, можно оценить возможный рост (падение) производительности труда за счет изменения отдельных факторов. Так, если нам известно, что изменение дебита скважин на 1 % приводит к изменению производительности труда на k %, то, зная величину изменения указанного фактора в планируемом периоде, можно рассчитать ожидаемый уровень производительности труда. Так как уравнения регрессии (20) — (22) выражают зависимость производительности труда от основных факторов не по каждому НГДУ, а в среднем по выборочной совокупности их, то прогнозируемые значения производительности труда целесообразно рассчитывать по формулам (20) — (22) лишь в отраслевом масштабе для отдельных групп НГДУ с растущей, стабильной или падающей добычей. [c.145]
Для точного описания уравнения регрессии необходимо знать условный закон распределения зависимой переменной Y при условии, что переменная X примет значение дс, т. е. Х=х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений (х/, у,) ограниченного объема п. В этом случае речь может идти об оценке (приближенном выражении, аппроксимаций) по выборке функции регрессии. Такой оценкой1 является выборочная линия (кривая) регрессии [c.52]
Проверка уравнения Фишера. Как ранее упоминалось, уравнение Фишера — это тождество, которое не может быть доказано или опровергнуто. Однако наблюдалось множество попыток ввести дополнительные ограничения для модели, чтобы проверить ее полезность для объяснения изменений процентных ставок во времени. Эти исследования восходят к работе самого Фишера, посвященной процентным ставкам и инфляции, где он обнаружил, что корреляция между темпами инфляции и ставкой по коммерческим бумагам оказалась низкой в обоих выборочных периодах (1890-1914 гг. и 1915-1927 гг.). Фама (Fama, 1975) предположил, что с течением времени серьезных изменений реальных ставок не происходит, поэтому данный процесс должен быть вызван исключительно изменениями в инфляции. Он протестировал данное положение, выстроив уравнение регрессии процентных ставок по отношению к ожидаемой инфляции [c.1193]
При практическом применении мнк-оценок исследователь часто сталкивается с явлением мультиколлинеарности, когда объясняющие переменные сильно коррелированы, т. е. существуют выраженные, хотя и неточные, линейные связи между несколькими или всеми объясняющими переменными. В этой ситуации точность обычных мнк-оценок резко падает ошибки некоторых параметров уравнения регрессии становятся очень большими, эти ошибки сильно скоррелированы, выборочные дисперсии резко возрастают. Резко сокращаются возможности интерпретации уравнения регрессии. Степень мультиколлинеарности измеряется либо обратной величиной минимального собственного числа нормированной (корреляционной) матрицы, либо числом обусловленности, равным отношению максимального собственного числа к минимальному. Если минимальное собственное число равно нулю, то степень мультиколлинеарности и число обусловленности являются бесконечно большими, и мы имеем дело с точной мультикол-линеарностью или вырожденной системой линейных уравнений. [c.297]
Коэффициент регрессии. Среднее квадратическое отклонение выборочного коэффициента уравнения регрес- [c.167]