Значение критерия Стьюдента намного больше его критического значения для значимости 0,01. Следовательно, коэффициент корреляции с очень большой вероятностью больше нуля связь установлена надежно. Для оценки надежности коэффициента корреляций можно воспользоваться таблицей критических значений для заданных уровней значимости (0,05 или 0,01) и числа степеней свободы (см. приложение, табл. 5). [c.249]
Например, по выборке объемом 32 единицы получен парный коэффициент корреляции 0,319. Число степеней свободы для него равно 30, поскольку в расчете г участвуют две величины, значения которых закреплены - J и у. За счет этого мы теряем две степени свободы 32 - 2. Так как критическое значение для 30 степеней свободы равно (при уровне значимости 0,05) 0,3494, то полученное значение ниже критического по модулю. Соответственно, гипотеза о связи признаков надежно не доказана. Неверен вывод и об отсутствии связи - он также надежно не доказан. Из табл. 5 приложения видно, что при малой выборке надежно можно установить только тесные связи, а при большой численности совокупности, например, 102 единицы, надежно измеряются и слабые связи. Этот вывод важен для практической работы по корреляционному анализу. [c.250]
Оценка существенности и расчет доверительных границ генерального коэффициента корреляции осуществляются так же, как и для коэффициента регрессии. Если значение R близко к единице, необходимо использовать преобразование Фишера, рассмотренное ранее в п. 8.2. Существуют также специальные таблицы критических значений коэффициента корреляции для заданного числа степеней свободы и вероятности нулевой гипотезы (см. приложение, табл. 5). [c.285]
Блок 5 — оценка значимости коэффициентов регрессий по величине -критерия. Расчетные значения t0n сравниваются с допустимым значением 4,/, которое определяется по таблицам t — распределения для заданной вероятности ошибок (а) и числа степеней свободы (/) [3]. [c.48]
Иногда при расчете коэффициента детерминации для получения несмещенных оценок дисперсии в числителе и знаменателе делается поправка на число степеней свободы, то есть скорректированный коэффициент детерминации вычисляется по формуле [c.111]
Отсюда видно, что при заданном наборе переменных у и х расчетное значение ух является в линейной регрессии функцией только одного параметра — коэффициента регрессии. Соответственно и факторная сумма квадратов отклонений имеет число степеней свободы, равное 1. [c.50]
При а = 0,05 для двустороннего критерия) и числе степеней свободы 5 табличное значение tb = 2,57. Так как фактическое значение -критерия превышает табличное, то, следовательно, гипотезу о несущественности коэффициента регрессии можно отклонить. Доверительный интервал для коэффициента регрессии определяется как b t-mb. Для коэффициента регрессии Ь в примере 95 %-ные границы составят [c.54]
Ввиду того, что rnz связаны между собой приведенным выше соотношением, можно вычислить критические значения г, соответствующие каждому из значений Z- Таблицы критических значений г разработаны для уровней значимости 0,05 и 0,01 и соответствующего числа степеней свободы. Критические значения г предполагают справедливость нулевой гипотезы, т. е. г мало отлично от нуля. Если фактическое значение коэффициента корреляции по абсолютной величине превышает табличное, то данное значение г считается существенным. Если же г оказывается меньше табличного, то фактическое значение г несущественно. [c.57]
На первый взгляд может показаться, что матрица парных коэффициентов корреляции играет главную роль в отборе факторов. Вместе с тем вследствие взаимодействия факторов парные коэффициенты корреляции не могут в полной мере решать вопрос о целесообразности включения в модель того или иного фактора. Эту роль выполняют показатели частной корреляции, оценивающие в чистом виде тесноту связи фактора с результатом. Матрица частных коэффициентов корреляции наиболее широко используется в процедуре отсева факторов. При отборе факторов рекомендуется пользоваться следующим правилом число включаемых факторов обычно в 6—7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной вариации очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, a F- критерий меньше табличного значения. [c.100]
Фактическое значение частного /"-критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы 1 и п — т — 1. Если фактическое значение Fx. превышает /"табл (a, dfu df2), то дополнительное включение фактора Xj в модель статистически оправданно и коэффициент чистой регрессии Ь, при факторе х,- статистически значим. Если же фактическое значение Fx. меньше табличного, то дополнительное включение в модель фактора х, не увеличивает существенно долю объясненной вариации признака у, следовательно, нецелесообразно его включение в модель коэффициент регрессии при данном факторе в этом случае статистически незначим. [c.132]
Величина /"-критерия, оценивая значимость уравнения регрессии в целом, характеризует одновременно и значимость коэффициента (индекса) множественной корреляции. Вместе с тем оценку существенности коэффициента множественной корреляции можно дать и через сравнение скорректированного коэффициента корреляции с его табличным значением при соответствующем уровне вероятности и числе степеней свободы п — т — 1. Так, при п = 30 и т = 2 фактическое значение R должно превышать 0,368 при 5 %-ном уровне значимости, чтобы можно было считать его значение отличным от нуля с вероятностью 0,95. [c.139]
Аналогично можно оценивать и существенность частных показателей корреляции. Фактическое значение частного коэффициента корреляции сравнивается с табличным значением при а = 0,05 или а = 0,01 и числе степеней свободы к = п — h — 2, где п — число наблюдений, А — число исключенных переменных. Так, если п = 30 и оценивается существенность частного коэффициента корреляции второго порядка (например, ryX[. xm), то А = 2 и к = 26. [c.140]
Если А является наивысшим порядком расчета частных коэффициентов корреляции для уравнения регрессии, то практически величина к совпадает с числом степеней свободы для остаточной вариации с п — т — 1. Так, в уравнении = а + Ьх х + b2 х2 + Ьъ х х д 3 + е, рассчитанном при п = 30, я — т — 1 = 26. Если же уравнение рефессии дополняется расчетом частных коэффициентов корреляции разных порядков (второго, третьего и т. п.), то [c.140]
Константа 5,071428 Коэффициент регрессии 1,261904 Стандартная ошибка коэффициента регрессии 0,101946 Л-квадрат 0,962315 Число наблюдений 8 Число степеней свободы 6 [c.267]
В итоговых таблицах указано значение F-статистики Фишера FH = = 20,6171 а также t-статистики Стьюдента tH= 4,5405. Сравнивая эти значения с табличными, мы оцениваем качество уравнения регрессии и статистическую значимость коэффициентов регрессии. Например, t табличное (для числа степеней свободы 15) равно 2,13. Это значение меньше наблю- [c.17]
Значимость коэффициентов частной корреляции и доверительный интервал вычисляются так же, как и для коэффициентов парной корреляции, но число степеней свободы для критерия ta.k принимается равным k = (п — 2) — р — 1, где (р — 1) — порядок частного коэффициента парной корреляции. [c.116]
Оценка значимости коэффициента конкордации производится по критерию согласия х2 ( хи-квадрат ), который подчиняется распределению с числом степени свободы п - 1. В нашем примере число степени свободы равно /1-1=6-1=5. [c.125]
Если существует k независимых переменных, то будет k + 1 коэффициентов регрессии (включая постоянную), отсюда число степеней свободы составит п—(k +1) или n—k—l. [c.284]
Проверим значимость коэффициентов. По табл. 6 квантилей распределения Стьюдента для числа степеней свободы f — N (п - 1) =8 2 = 16 и вероятности Р = [c.100]
Далее, если обозначим коэффициент корреляции генеральной совокупности х и у как р, а р = 0, иными словами, в условиях отсутствия корреляции между х и у коэффициент корреляции статистических величин г будет находиться где-то вокруг значения нуля и не примет нормального распределения, подчиняясь симметричному распределению по правую и левую сторону от нуля. Данная ситуация иллюстрируется рис. 9.3. Число степеней свободы Ф коэффициента корреляции, поскольку для ее вычисления предусматривается использование двух расчетных значений х и у, образуется в результате вычитания цифры 2 из числа п, т. е. (п —2). [c.160]
Прогноз продаж на ближайший период в соответствии с моделью (7.57) составит г/6 = 3,2 + 1,1x6 = 9,35 тыс. ед. Ошибка прогноза может быть вычислена по формуле (7.8) и составит 1,14 тыс. ед. Доверительные границы прогноза найдем по формуле (7.9). Число степеней свободы k = = 5-2 = 3, коэффициент Стьюдента для уровня значимости 0,05 = = 3,182. Нижняя граница интервала прогноза равна 9,35 - 1,14 х 3,182 = = 5,72 тыс. ед., верхняя граница равна 9,35 + 1,14 х 3,182 = 12,99 тыс. ед. [c.208]
Пусть необходимо построить 100(1 - а)%-ный доверительный интервал для коэффициента pj. Тогда по таблице критических точек распределения Стьюдента по требуемому уровню значимости а и числу степеней свободы v находят критическую точку t6 [c.152]
Иногда при расчете коэффициента детерминации для получения несмещенных оценок в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы. Вводится так называемый скорректированный (исправленный) коэффициент детерминации [c.155]
Если (п-т- ), то есть число степеней свободы, достаточно велико (не менее 8-10), то при 5%-ном уровне значимости и двусторонней альтернативной гипотезе критическое значение f-статистики приблизительно равно двум. Здесь, как и в случае парной регрессии, можно приближенно считать оценку незначимой, если /-статистика по модулю меньше единицы, и весьма надежной, если модуль t-статистики больше трех. Другие критерии качества полученного уравнения регрессии будут рассмотрены в следующей главе. Там же будут приведены и примеры статистического анализа значимости коэффициентов множественной линейной регрессии. [c.309]
Он характеризует долю вариации (разброса) зависимой переменной, объясненной с помощью данного уравнения. В качестве меры разброса зависимой переменной обычно используется ее дисперсия, а остаточная вариация может быть измерена как дисперсия отклонений вокруг линии регрессии. Если числитель и знаменатель вычитаемой из единицы дроби разделить на число наблюдений л, то получим, соответственно, выборочные оценки остаточной дисперсии и дисперсии зависимой переменной . Отношение остаточной и общей дисперсий представляет собой долю необъясненной дисперсии. Если же эту долю вычесть из единицы, то получим долю дисперсии зависимой переменной, объясненной с помощью регрессии. Иногда при расчете коэффициента детерминации для получения несмещенных оценок дисперсии в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы тогда [c.313]
Сумма квадратов остатков е2 = е е является естественным кандидатом на оценку дисперсии ошибок а1 (конечно, с некоторым поправочным коэффициентом, зависящим от числа степеней свободы) [c.73]
Хотя теорема 14.1 верна независимо от того, известна дисперсия сг2 или нет, в большей части данной главы предполагается, что сг2 известна. Конечно, это предположение не реалистично, и следует коснуться вопроса о том, как изменяются наши результаты в случае, когда дисперсия сг2 неизвестна. Рассмотрим в качестве примера случай, соответствующий рис. 14.3, где т = 1, д2 = оо, с = 1.96. В случае, когда сг2 известна, ожидаемые значения коэффициента занижения E(UR) равны 0.82, 0.86, 0.79, 0.19 для г , равного соответственно О, 1, 2, 4. В случае неизвестной дисперсии а2 вычисления сложнее и результат зависит от числа степеней свободы п — k — т. В таблице 14.1 приведена сводка результатов. [c.429]
Оценим уравнение регрессии u SLS на х1=1,х2,х3,хл. Полученное значение коэффициента детерминации равно 0.000319, так что / = nR2 =0.00957. Число степеней свободы равно 4-3 = 1. Поскольку Р-значение равно 0.922, гипотеза пригодности использованных инструментов не отвергается. (Если оценить [c.201]
S(b) — среднее квадратическое отклонение коэффициента Ь tn 2. к — значение критерия Стьюдента при числе степеней свободы [c.87]
Для проверки существования AR H необходимо возвести в квадрат ошибки из первоначального уравнения условной средней. Этот ряд квадратов регрессируется по константе и прошлым значениям квадратов с лагом р. Критерием является Т R2, где Т — размер выборки и R2 — коэффициент множественной регрессии из уравнения регрессии квадратов ошибок. Этот критерий подчиняется х2 РаспРеДелению. Число степеней свободы равно числу временных лагов в регрессии. Если значение критерия больше критического значения из таблиц х2, то нулевая гипотеза о том, что AR H не присутствует, отвергается. [c.356]
Используемая статистика Fq+l формально совпадает со статистикой для проверки значимости соответствующего регрессионного коэффициента в обычной задаче регрессии. Поэтому в качестве значения для Ръкп, как правило, выбирают классические уровни йачимости (5, 10, 15%), соответствующие F-распределению с 1 и (я — q — 2) степенями свободы. Однако величина Fq+i в пошаговой процедуре на самом деле не подчиняется -распределению с соответствующим числом степеней свободы, поскольку проверяется гипотеза о равенстве нулю максимального по абсолютной величине коэффициента частной корреляции из р-—.q коэффициентов частной корреляции для переменных, не входящих в X (q). Неизвестно поэтому, какому уровню значимости соответствует выбранное значение [c.288]
Значение критерия Фишера, вычисленное по формуле (10.10) сравнивают с табличным значением для выбранного уровня значимости. Если расчетное значение не превышает табличного, то гипотезу адекватности принимают. Для отыскания табличного значения критерия требуется еще знать число степеней свободы, связанных с числителем и знаменателем выражения (10.10). Они представляют собой знаменатели тех формул, по которым вычисляют соответствующие дисперсии. Наряду с прямой оценкой адекватности, которая описана выше, существует ряд косвенных признаков, по которым можно судить о степени адекватности модели. Часто для оценки дисперсии опыта используют параллельные эксперименты в нулевой точке. Различие между средним значением из этих опытов и свободным членом линейного уравнения характеризует суммарный вклад квадратичных эффектов. Если это различие незначимо, например по критерию Стьюден-та, то можно предполагать, что модель адекватна. Такая проверка не является абсолютной, так как возможно, что сумма положительных коэффициентов при квадратах близка к сумме отрицательных. [c.231]
Примечание. Заметим, что в таблице для гкрит (прил.1) вместо привычных значений числа измерений п стоит показатель /, характеризующий так называемую степень свободы. Число степеней свободы в статистике определяется как разность между количеством опытов (измерений) п и числом коэффициентов (констант), которые уже рассчитаны по результатам этих опытов, т.е. / = п - k, где k - это количество вычисленных констант. В нашем случае в формуле для г участвуют две константы j и у, поэтому на г остается только п —2 свободных измерений, т.е. —2=7 — 2 = 5. [c.23]