Пошаговый отбор переменных 21, [c.303]
Процедура пошагового отбора переменных [c.122]
Для устранения мультиколлинеарности применим процедуру пошагового отбора наиболее информативных переменных. [c.114]
Если имеется возможность использовать ПВП, целесообразно провести, помимо автоматизированного отбора, также и несколько вариантов отбора с различными ПВП. Окончательный набор получится в результате сравнения найденных наборов. Состав ПВП определяется, например, из экспертных соображений. Другой возможный подход к формированию ПВП основан на анализе графика какого-либо из критериев качества набора, выводимого при работе пошаговых процедур. С этой целью отбор переменных целесообразно проводить по возможности до исчерпания всего исходного множества потенциальных переменных с одновременным выводом на каждом шаге значений коэффициентов детерминации и критериев качества набора. Такой режим легко осуществить, если в процедуре предусмотрено условие остановки по достижении определенного числа k переменных в выходном наборе. Тогда, например, для процедур прямого присоединения и присоединения-удаления достаточно положить k = р. В случае условия остановки, управляемого величиной Ршл, увеличения числа отбираемых переменных можно добиться, уменьшая [c.294]
Алгоритмы отбора переменных отличаются используемым критерием качества набора и способом генерации наборов переменных для их сравнения. Из схем генерации удобными с вычислительной точки зрения являются пошаговые схемы — простого добавления, простого удаления, добавления с удалением и схемы выметания. В настоящее время в связи с рос- [c.297]
Пошаговые процедуры отбора переменных 286 Правило порядка 409, 424 — ранга 409, 424 [c.474]
Метод пошаговой регрессии, включенный во многие статистические пакеты, позволяет из множества исходных переменных производить отбор тех переменных, которые наиболее значимы для адекватного представления исходных данных. Этот метод позволяет, во-первых, построить более простую, сокращенную модель, а, во-вторых, при последующем сборе данных не регистрировать несущественные переменные. Он может быть использован в качестве предварительного этапа перед построением нелинейной модели. [c.92]
Еще одним из возможных методов устранения или уменьшения мультиколлинеарности является использование пошаговых процедур отбора наиболее информативных переменных. Например, [c.111]
В случае обнаружения мультиколлинеарности принять меры по ее устранению (уменьшению), используя пошаговую процедуру отбора наиболее информативных переменных. [c.112]
Используя пошаговую процедуру отбора наиболее информативных объясняющих переменных, определить подходящую регрессионную модель, исключив при этом мультиколлинеарность. Оценить значимость коэффициентов регрессии полученной модели по f-критерию. [c.131]
Повторное применение процедур отбора с принудительно включаемыми переменными (ПВП). Возможность принудительного (обязательного) включения переменных в выходной набор X (q) достигается достаточно простой модификацией описанных пошаговых процедур, а также методов всех регрессий и ветвей и границ . [c.294]
Рассмотрим вопрос о регрессии. В ряде случаев именно от его решения — оценки уравнений регрессии — зависят оценки тесноты связи, а они, в свою очередь, дополняют результаты регрессионного анализа. Прежде всего следует определить перечень независимых переменных X, включаемых в уравнение. Это должно делаться на основе теоретических положений. Список X может быть достаточно широк и ограничен только исходной информацией. На практике теоретические положения о сути взаимосвязи подкрепляются парными коэффициентами корреляции между зависимой и независимыми переменными. Отбор наиболее значимых из них можно провести с помощью ЭВМ, выбирая в соответствии с коэффициентами корреляции и другими критериями факторы, наиболее тесно связанные с У. Параллельно решается вопрос о форме уравнения. Современные средства вычислительной техники позволяют за относительно короткое время рассчитать достаточно много вариантов уравнений. В ЭВМ вводятся значения зависимой переменной У и матрица независимых переменных X, принимается форма уравнения, например линейная. Ставится задача включить в уравнение k наиболее значимых X. В результате получим уравнение регрессии с k наиболее значимыми факторами. Аналогично можно выбрать наилучшую форму связи. Этот традиционный прием, называемый пошаговой регрессией, если он не противоречит качественным посылкам, достигает приемлемых результатов. Первоначально обычно берется линейная модель множественной регрессии [c.134]
Замечание. Так как значения коэффициентов корреляции весьма высокие (больше 0,8) /-12=0,85, ri3=0,98, /-23=0,88, то, очевидно, из соответствующих трех переменных Х, Х , здве переменные можно было сразу исключить из регрессии и без проведения пошагового отбора, но какие именно переменные исключить — следовало решать, исходя из качественных соображений, основанных на знании предметной области (в данном случае влияния на урожайность факторов сельскохозяйственного производства). [c.115]