Выбор общего вида функции регрессии

Следует подчеркнуть, что этап 4 (см. В.6), т. е. этап исследования, посвященный выбору общего вида функции регрессии (параметризация модели), бесспорно, является ключевым от того, насколько удачно он будет реализован, решающим образом зависит точность восстановления неизвестной функции регрессии / (X). В то же время приходится признать, что этот этап находится, пожалуй, в самом невыгодном положении к сожалению, не существует системы стандартных рекомендаций  [c.175]


Остановимся на некоторых рекомендациях, связанных с реализацией трех основных моментов, учет которых необходим при решении проблемы выбора общего вида функции регрессии 1) максимальное использование априорной информации о содержательной (физической, экономической, социологической и т. п.) сущности анализируемой зависимости 2) предварительный анализ геометрической структуры исходных данных вида (6.1), на основании которых конструируется искомая зависимость 3) различные статистические приемы обработки исходных данных, позволяющие сделать наилучший выбор из нескольких сравниваемых вариантов.  [c.176]

Прежде всего исследователь должен сосредоточить свои усилия на анализе содержательной сущности искомой статистической зависимости, чтобы максимально использовать имеющиеся априорные сведения о физическом механизме изучаемой связи при выборе общего вида функции регрессии.  [c.207]

Статистические критерии проверки гипотез об общем виде функции регрессии. Подчеркнем сразу, что описанные ниже критерии проверки справедливости сделанного выбора общего  [c.200]


Этап 7 (анализ точности полученных уравнений связи). Исследователь должен отдавать себе отчет в том, что найденная им в соответствии с (В.24) аппроксимация f (X) неизвестной теоретической функции fT (X) из соотношений типа (В. 14), (В. 16) или (В.21) (называемая эмпирической функцией регрессии, см. гл. 5) является лишь некоторым приближением истинной зависимости fT (X)1. При этом погрешность в описании неизвестной истинной функции fT (X) с помощью f (X) в общем случае состоит из двух составляющих а) ошибки аппроксимации 6F и б) ошибки выборки б (/г). Величина первой зависит от успеха в реализации этапа 4, т. е. от правильности выбора класса допустимых решений F. В частности, если класс F выбран таким образом, что включает в себя и неизвестную истинную функцию f (т. е. fT (X) F), то ошибка аппроксимации 6F = 0. Но даже в этом случае остается случайная составляющая (ошибка выборки) б (/г), обусловленная ограниченностью выборочных данных вида (В.1), па основании которых мы подбираем функцию f (X) (оцениваем ее параметры). Очевидно, уменьшить ошибку выборки мы можем за счет увеличения объема п обрабатываемых выборочных данных, так как при fT (X) F (т. е. при 6F — 0) и правильно выбранных методах статистического оценивания (т. е. при правильном выборе оптимизируемого функционала качества модели Дп (/)) ошибка выборки б (/г) -> 0 (по вероятности) при п — оо (свойство состоятельности используемой процедуры статистического оценивания неизвестной функции fT (X)).  [c.52]

В результате такого анализа обычно получают формулировку нескольких рабочих гипотез об общем виде искомой зависимости, окончательная проверка которых и выбор наиболее адекватной из них осуществляются (при отсутствии априорных сведений содержательного характера) с помощью соответствующих математико-статистических методов. Описание наиболее эффективных, с нашей точки зрения, приемов такого типа приводится в 6.3. Здесь же остановимся на двух вспомогательных приемах, которые полезно использовать при геометрическом анализе парных корреляционных полей. 6.2.2. Учет и формализация гладких свойств искомой функции регрессии. Выше упоминалось, что чрезмерное усложнение класса допустимых решений F и, в частности, завышение порядка аппроксимирующего регрессионного полинома (в но-  [c.181]


Предполагается также, что этап выбора общего параметрического вида искомой зависимости (этап 4, см. В. 6) реализован удачно, а именно в качестве класса допустимых решений F определено семейство, накрывающее истинную функцию регрессии (11.3), т. е.  [c.337]

Интуитивные соображения относительно соблюдения необходимых свойств гладкости, высказываемые при выборе общего вида функции регрессии / (х), могут быть формализованы с помощью так называемых функционалов гладкости L (/). Эти функционалы2 устроены таким образом, что чем более гладкой, более плавной является функция f (х), тем меньшее числовое значение они принимают. Нетрудно показать, что к такого рода функционалам относятся функционалы вида  [c.183]

Неточный выбор общего вида функции регрессии, приводящий к нарушению базового допущения (11.21), на которое существенно опираются все выводы по оцениванию точности регрессионной модели, может заключаться как в неполном или избыточном представлении набора объясняющих переменных х(1 л (2),. .., х(р так и в искажении самой структуры модели. Наиболее неприятные последствия влечет второй тип ошибки1. В этом можно убедиться при рассмотрении примера 6.2, а также примера, представленного в табл. 6.2 и на рис. 62. Действительно, анализируя данные табл. 6.1 (в которой представлены результаты расчетов по примеру 6.2), мы видим, в частности, что при использовании формально-ап-проксимационных вариантов регрессионной модели (т. е. в ситуации / (X) 5= F) оценки среднеквадратической ошибки  [c.356]

Достаточно исчерпывающие и теоретически обоснованные ответы на эти вопросы мы в состоянии дат лишь в рамках схемы, постулирующей, что а) выбор класса F допустимых решений (т. е. выбор общего параметрического вида функции регрессии / (X)) осуществлен удачно, а именно / (X) 6 F б) рмеется априорная информация о вероятностной природе чнапример, о типе закона распределения) регрессионных ос-  [c.335]