Матрица значений зависимой переменно

Рассмотрим вопрос о регрессии. В ряде случаев именно от его решения — оценки уравнений регрессии — зависят оценки тесноты связи, а они, в свою очередь, дополняют результаты регрессионного анализа. Прежде всего следует определить перечень независимых переменных X, включаемых в уравнение. Это должно делаться на основе теоретических положений. Список X может быть достаточно широк и ограничен только исходной информацией. На практике теоретические положения о сути взаимосвязи подкрепляются парными коэффициентами корреляции между зависимой и независимыми переменными. Отбор наиболее значимых из них можно провести с помощью ЭВМ, выбирая в соответствии с коэффициентами корреляции и другими критериями факторы, наиболее тесно связанные с У. Параллельно решается вопрос о форме уравнения. Современные средства вычислительной техники позволяют за относительно короткое время рассчитать достаточно много вариантов уравнений. В ЭВМ вводятся значения зависимой переменной У и матрица независимых переменных X, принимается форма уравнения, например линейная. Ставится задача включить в уравнение k наиболее значимых X. В результате получим уравнение регрессии с k наиболее значимыми факторами. Аналогично можно выбрать наилучшую форму связи. Этот традиционный прием, называемый пошаговой регрессией, если он не противоречит качественным посылкам, достигает приемлемых результатов. Первоначально обычно берется линейная модель множественной регрессии  [c.134]


Предположение I. Пусть задано начальное значение зависимой переменной, которое мы обозначим У0. Тогда условное распределение У Yt,. .., Уп при данном УО И при данной матрице X можно записать  [c.304]

Кроме того, полагают, что число имеющихся наблюдений (значений) каждой из объясняющих и зависимой переменных превосходит ранг матрицы X, т. е. п>г (X) или п>р+, ибо в противном случае в принципе невозможно получение сколько-нибудь надежных статистических выводов.  [c.86]

Мультиколлинеарность в основном появляется в задачах пассивного эксперимента, когда исследователь, собирая данные, не может влиять на значения объясняющих переменных. В активном эксперименте матрица данных X планируется (см. [ 1361), причем таким образом, что либо матрица S хорошо обусловлена, либо априори точно известны линейные зависимости, имеющие место между строками (столбцами матрицы X), и, следовательно, ее ранг.  [c.253]


Здесь Y - вектор-столбец размерности п наблюдений зависимой переменной Y X - матрица размерности п х (т + 1), в которой 1-я строка (i = 1, 2,. .., п) представляет наблюдение вектора значений независимых переменных Хь Х2,. .., Хт единица соответствует переменной при свободном члене bo В - вектор-столбец размерности (т  [c.145]

При X] =0 имеем булев вектор <1011>, с учетом весов этот вектор интерпретируется как число 13. При Х = 1 имеем <01 1 1>, что соответствует числу 14. Тогда значение первого столбца булевой матрицы в зависимости от значения переменной Х] можно изобразить как  [c.30]

Первый этап состоит в формулировании проблемы факторного анализа и определении переменных, подвергаемых факторному анализу. Затем строится корреляционная матрица переменных и выбирается метод факторного анализа. Исследователь выбирает число факторов, которые следует выделить, и метод вращения факторов. Далее повернутые факторы следует интерпретировать. В зависимости от целей, можно вычислить значения факторов или отобрать  [c.721]

Анализируя матрицу парных коэффициентов, можно сделать вывод, что скорее всего в модель будут входить элементы Х2,хз,х4. Это связано с сильной зависимостью между этими показателями и у (соответственно 0,96 -0,8 0,95), то есть значение парного коэффициента корреляции между переменной и у должно быть максимально приближено к 1.  [c.103]

В качестве значений зависимой переменной в момент t мы можем использовать yt или, например, прогноз yt. Матрица ковариаций вектора у по условию модели равна V(y) = <72In. Матрица ковариаций вектора прогноза равна  [c.77]

Коль скоро OLS-регрессия не всегда способна уловить все имеющиеся функциональные связи между независимыми и зависимыми переменными, нужно искать другие пути к пониманию поведения переменных. Мы расскажем здесь о двух интуитивных эвристических подходах. В первом из них важность переменной оценивается путем сравнения погрешности прогноза, полученного при исходной входной матрице, с погрешностью, которая получится, если значения всех переменных заменить на их средние значения. Во втором эвристическом методе вклад отдельной переменной оценивается по степени надежности выхода сети (de isiveness). Метод работает наперед (ex ante), не обращаясь к реальным значениям целевой переменной или погрешности. Его недостаток состоит в том, что переменные могут быть классифицированы в соответствии с тем, поддерживают или противоречат ли они выдаваемому решению, а это решение на самом деле может быть неправильным.  [c.147]


В предыдущих разделах предполагалось, что независимые переменные (матрица X) являются неслучайными. Ясно, что такое условие выполнено не всегда, например, во многих ситуациях при измерении независимых переменных могут возникать случайные ошибки. Кроме того, при анализе временных рядов значение исследуемой величины в момент t может зависеть от ее значений в предыдущие моменты времени, т. е. в некоторых уравнениях эти значения выступают в качестве независимых, а в других — в качестве зависимых переменных (модели с лагированными переменными). Поэтому возникает необходимость рассматривать модели со стохастическими регрессорами.  [c.149]

В зависимости от ситуации D,Ha4. может относиться к ретроспективному участку некоторой длительности, определяемой памятью объекта управления, т.е. интервалом времени, на котором предшествующие его состояния еще значимо сказываются на текущем и будущем состояниях — имеется значимая связь между этими состояними. Протяженность этого интервала времени может простираться от нуля (объект управления без памяти) до бесконечности (объект управления с бесконечной памятью). Промежуточное значение длины этого интервала порождает объекты с ограниченной памятью. В свою очередь, отображаемые в пространстве D, переменные А, Е] и Е2 также могут учитываться с некоторым ретроспективным отставанием (лагом), т.е. состояние объекта управления в некоторый момент времени, в том числе будущий, зависит от его состояния в предшествующие моменты времени. В общем случае все переменные, отраженные в процессоре Роу, являются матрицами, т.е. этих переменных может быть несколько и они могут быть развернуты во времени.  [c.85]

Для проверки целесообразности использования факторной модели анализа зависимости перменных существует несколько статистик. С помощью критерия сферичности Бартлетта проверяется нулевая гипотеза об отсутствии корреляций между переменными в генеральной совокупности другими словами, рассматривается утверждение о том, что корреляционная матрица совокупности — это единичная матрица, в которой все диагональные элементы равны 1, а все остальные равны 0. Проверка с помощью критерия сферичности основана на преобразовании детерминанта корреляционной матрицы в статистику хи-квадрат. При большом значении статистики нулевую гипотезу отклоняют. Если же нулевую гипотезу не отклоняют, то целесообразность выполнения факторного анализа вызывает сомнения. Другая полезная статистика — критерий адекватности выборки (КМО). Данный коэффициент  [c.723]

Эконометрика (2002) -- [ c.83 ]