Тип 1 Установление самого факта наличия (или отсутствия) статистически значимой связи между Y и X. При такой постановке задачи статистический вывод имеет двоичную (альтернативную) природу — связь есть или связи нет — и сопровождается обычно лишь численной характеристикой (измерителем) степени тесноты исследуемой зависимости. Выбор формы связи (т. е. класса допустимых решений F и конкретного вида функции f (X) в модели (В.З)) и состава предикторов X играет подчиненную роль и нацелен исключительно на максимизацию величины этого измерителя степени тесноты связи исследователю часто не приходится даже добираться до конкретного вида функции f (X) и тем более он не претендует на анализ причинных влияний переменных X на результирующие показатели. [c.20]
Этап 4 (определение класса допустимых решений). Главной целью исследователя на этом этапе является определение общего вида, структуры искомой связи между Y и X, или, другими словами, описание класса функций F, в рамках которого он будет производить дальнейший поиск конкретного вида интересующей его зависимости (см. задачи а) и 3 в В.1). Чаще всего это описание дается в форме некоторого параметрического семейства функций / (X в), поэтому и этап этот называют также этапом параметризации модели. Так, определив в примере В.1, что поиск зависимости среднедушевых семейных сбережений //ср от величины их среднедушевого дохода х мы будем производить в классе F = (60 + QI линейных функций, мы тем самым завершили четвертый этап исследования (но конкретных числовых значений параметров 00 и 0 мы к этому моменту еще не знаем). [c.49]
Этап 7 (анализ точности полученных уравнений связи). Исследователь должен отдавать себе отчет в том, что найденная им в соответствии с (В.24) аппроксимация f (X) неизвестной теоретической функции fT (X) из соотношений типа (В. 14), (В. 16) или (В.21) (называемая эмпирической функцией регрессии, см. гл. 5) является лишь некоторым приближением истинной зависимости fT (X)1. При этом погрешность в описании неизвестной истинной функции fT (X) с помощью f (X) в общем случае состоит из двух составляющих а) ошибки аппроксимации 6F и б) ошибки выборки б (/г). Величина первой зависит от успеха в реализации этапа 4, т. е. от правильности выбора класса допустимых решений F. В частности, если класс F выбран таким образом, что включает в себя и неизвестную истинную функцию f (т. е. fT (X) F), то ошибка аппроксимации 6F = 0. Но даже в этом случае остается случайная составляющая (ошибка выборки) б (/г), обусловленная ограниченностью выборочных данных вида (В.1), па основании которых мы подбираем функцию f (X) (оцениваем ее параметры). Очевидно, уменьшить ошибку выборки мы можем за счет увеличения объема п обрабатываемых выборочных данных, так как при fT (X) F (т. е. при 6F — 0) и правильно выбранных методах статистического оценивания (т. е. при правильном выборе оптимизируемого функционала качества модели Дп (/)) ошибка выборки б (/г) -> 0 (по вероятности) при п — оо (свойство состоятельности используемой процедуры статистического оценивания неизвестной функции fT (X)). [c.52]
Взаимоотношения истинной и Д-регрессий существенно зависят от вероятностной природы регрессионных остатков е (X) в моделях типа (5. 1) и от способа выбора класса допустимых решений F. Попробуем вначале понять эти взаимоотношения на примере. [c.170]
Расположение точек — наблюдений на рис. 5.1 дает нам основание ограничить класс допустимых решений только линейными зависимостями, т. е. определить в качестве класса допустимых решений параметрическое семейство [c.171]
Напротив, если бы мы правильно выбрали класс допустимых решений, что в данном примере означало бы [c.172]
Истинная регрессия f (X) = Е(т) = X) является одновременно среднеквадратической, т. е. дает решение оптимизационной задачи вида (5.6) при квадратичной функции потерь (при отсутствии ограничений на класс допустимых решений F). [c.174]
Наиболее распространенными в статистической практике являются параметрические регрессионные схемы, когда в качестве класса допустимых решений выбирается некоторое параметрическое семейство функций [c.175]
Но до перехода к процедуре статистического оценивания неизвестного значения параметра мы должны сделать и обосновать определенный выбор типа параметрического семейства (6.2). Так, например, в качестве класса допустимых решений можно использовать [c.175]
В результате такого анализа обычно получают формулировку нескольких рабочих гипотез об общем виде искомой зависимости, окончательная проверка которых и выбор наиболее адекватной из них осуществляются (при отсутствии априорных сведений содержательного характера) с помощью соответствующих математико-статистических методов. Описание наиболее эффективных, с нашей точки зрения, приемов такого типа приводится в 6.3. Здесь же остановимся на двух вспомогательных приемах, которые полезно использовать при геометрическом анализе парных корреляционных полей. 6.2.2. Учет и формализация гладких свойств искомой функции регрессии. Выше упоминалось, что чрезмерное усложнение класса допустимых решений F и, в частности, завышение порядка аппроксимирующего регрессионного полинома (в но- [c.181]
Этап параметризации регрессионной модели, т. е. выбора параметрического семейства функций (класса допустимых решений), в рамках которого производится дальнейший поиск неизвестной функции регрессии, является одновременно наиболее важным и наименее теоретически обоснованным этапом регрессионного анализа. [c.207]
Предполагается также, что этап выбора общего параметрического вида искомой зависимости (этап 4, см. В. 6) реализован удачно, а именно в качестве класса допустимых решений F определено семейство, накрывающее истинную функцию регрессии (11.3), т. е. [c.337]
Решающим моментом во всей процедуре исследования точности статистических выводов в регрессионном анализе является соотношение между истинной функцией регрессии / (X) и выбранным исследователем параметрическим классом допустимых решений Г — fa (/Y в) еег- Если класс F выбран удачно (т. е. если / (X) 6 F), то исследователь находится в рамках идеализированной схемы и при некоторых дополнительных априорных сведениях о природе регрессионных остатков е (А ) = ц — / (X) имеет возможность дать достаточно точный ответ на все три основных вопроса анализа точности регрессионной модели (см. 11.1, 11.2). [c.360]
F — класс допустимых решений (класс функций, в рамках которого [c.458]
Класс допустимых решений F 16, 17, 49, 51, 168, 175 Классификационные (номинальные) переменные 23 Ковариационная матрица мнк-оценок 339 [c.472]
Этап параметризации модели (определение класса допустимых решений) см. также Структура модели регрессии 11, 22, 49,. 174 [c.475]
Новый этап в развитии методов экономико-математического моделирования начался в конце пятидесятых годов, когда появление вычислительной техники сделало многовариантные плановые расчеты на основе экономико-математических моделей реализуемыми по крайней мере принципиально. На развитие экономико-математических методов в это время большое влияние оказали работы Л. В. Канторовича, который в результате анализа некоторых задач планирования производства сформулировал новый важный для экономики класс математических задач, получивших название задач линейного программирования. В линейном программировании рассматривается вопрос о поиске среди всех допустимых решений, удовлетворяющих системе линейных равенств и неравенств, наилучшего (оптимального) решения, доставляющего максимум (или минимум) некоторому линейному критерию. В настоящее время линейное программирование является основным математическим методом анализа задач планирования производства. [c.16]
Из леммы Кротова вытекает, что для нахождения решения исходной задачи достаточно построить такую расширенную задачу, оптимальное решение которой оказалось бы допустимым для некоторой задачи из класса А. В том случае, когда исходная задача имеет решение в форме максимизирующей последовательности, достаточно, чтобы решение либо предел максимизирующей последовательности расширенной задачи можно было сколь угодно точно приблизить последовательностью допустимых решений исходной. [c.316]
Так как в достаточно широком классе случаев решения задачи (Vty описывают Парето-границу, то целевую функцию задачи (У можно использовать для решения вопроса о принадлежности некоторого допустимого состояния к Парето-границе. В связи с этим, естественно рассматривать функцию [c.219]
По всем разумным показателям (среднему числу простоев, среднему времени простоя, потерям производительности из-за простоев и т.п.) централизованное обслуживание обладает преимуществом. При неучете информационных аспектов процесса децентрализация может только ухудшить качество работы, поскольку она ограничивает класс допустимых стратегий. Вообще же должны учитываться расходы на обработку информации и повышение быстродействия (свойство прямых связей). Удобно считать оптимальным такое правило принятия решений в каждом локальном центре, при котором минимизируются затраты на хранение запаса только в ассоциированных с этим центром складах (при фиксированной гарантии удовлетворения внешнего для этих складов спроса). [c.199]
Канбан (см. [К 13]) и МРП(см. [М 126]). Система ОПТ, как и система Канбан, относится к классу "тянущих" (см. [С 95]) систем организации снабжения и производства. Отдельные западные специалисты не без оснований считают, что ОПТ — это фактически компьютеризованный вариант системы Канбан, с той существенной разницей, что ОПТ предотвращает возникновение узких мест в цепи "снабжение—производство — сбыт", а Канбан позволяет эффективно устранять уже возникшие "узкие" места. Основным принципом системы ОПТ является выявление в производственной системе "узких" мест или, по терминологии ее создателей, критических ресурсов. В качестве критических ресурсов могут выступать, например, запасы сырья и материалов, машины и оборудование, технологические процессы, персонал. От эффективности использования критических ресурсов зависит эффективность производственной системы в целом, в то время как интенсификация использования остальных ресурсов, называемых некритическими, на развитии системы практически не сказывается. Потери критических ресурсов крайне негативно сказываются на производственной системе в целом, в то время как экономия некритических ресурсов реальной выгоды, с точки зрения конечных результатов, не приносит. Количество критических ресурсов для каждой производственной системы составляет в среднем пять. Исходя из рассмотренного выше принципа, фирмы, использующие систему ОПТ, не стремятся обеспечить стопроцентную загрузку рабочих, занятых на некритических операциях, поскольку интенсификация труда этих рабочих приведет к росту незавершенного производства и другим нежелательным последствиям. Фирмы поощряют использование резерва рабочего времени таких рабочих на повышение квалификации, проведение собраний кружков качества (см. [К 179]) и т.п. В системе ОПТ на ЭВМ решается ряд задач оперативного управления производством, в том числе формирования графика производства на один день, неделю и т.п. При формировании близкого к оптимальному графика производства используются следующие критерии 1. Степень удовлетворения потребности производства в ресурсах. 2. Эффективность использования ресурсов. 3. Средства, изъятые из фондов незавершенного производства. 4. Гибкость графика, т.е. возможность его реализации при аварийных остановах оборудования и при недопоставке материальных ресурсов. При реализации графика система ОПТ контролирует использование производственных ресурсов для изготовления заказанной продукции за фиксированные интервалы времени. Продолжительность этих интервалов определяется экспертным путем. В течение каждого интервала принимаются решения по оперативному управлению процессом производства. Чтобы облегчить принятие решений, программным путем определяются приоритеты каждого вида продукции с использованием весовых функций, так называемых управленческих коэффициентов (заказная норма, срок изготовления и др.) и других критериев (допустимый уровень страховых запасов, дата отгрузки изготовленной продукции и т.д.). На основе перечня приоритетов продукции ЭВМ планирует максимальное обеспечение ресурсами продукции, имеющей высший (нулевой) приоритет, а обеспечение всей остальной продукции — по убыванию [c.391]
Ввиду небольшой точности (погрешность 30-40 %) использование экспертного метода допустимо только при решении задач особого класса при наличии условий [c.58]
Ценности так же, как и расположение, оказывают сильное влияние на предпочтения человека, на принимаемые им решения и поведение в коллективе. Однако между ценностями и расположениями есть огромная разница. Если последние определяют отношение человека к объекту по принципу нравится — не нравится , люблю — не люблю и всегда относятся к какому-то определенному объекту, то ценности задают предпочтение человека по принципу допустимо — недопустимо , хорошо — плохо , полезно — вредно и т.п. При этом ценности носят достаточно абстрактный и обобщающий характер, живут самостоятельной жизнью, независимо от конкретного человека, сформулированы в виде заповедей, утверждений, мудростей, общих норм и могут разделяться большими группами людей. Поэтому, если расположение всегда сугубо персонально, то носителями ценностей являются группы людей (например, ценности среднего класса), а каждый отдельный человек принимает какой-то набор ценностей, который он может и менять, но которому он следует в каждый конкретный момент времени. [c.97]
Ясно, что допустимый класс кривых должен быть таким, чтобы решение задачи было единственным (это обстоятельство сильно помогает в преодолении многих трудностей поиска). Кроме того, желательно, чтобы построенная кривая изменялась плавно. [c.124]
Поскольку диапазон значений мультипликаторов приходится сужать, нам не обойтись без произвольных решений. Нам сложно обосновать разумность нашего выбора, но предлагаем принять в качестве границ допустимого диапазона значения 6 и 18. Эти значения мультипликатора могут быть применены к текущим значениям нормальной прибыли. Выбранное нами значение мультипликатора 12,3 раза для средних промышленных акций инвестиционного класса (то есть для индекса S P 400) попадает примерно в середину предложенного нами коридора значении. В главе 30 мы предложили правило, по которому цена за высококачественные акции роста должна не более чем на 50% превышать цену за средние акции, то есть надбавка за повышенные темпы роста должна быть ограниченной. Если принять в качестве базового значения мультипликатора 12,3, цена любых акций не должна больше чем в 18 1/2 раза превышать текущую оценку нормальной прибыли, и только исключительные обстоятельства могут оправдать отступление от этого правила. [c.609]
Диагностирование осуществлялось на основе линейной модели рассматриваемого производства. Возможными источниками несовместности являются поступление керосино-гайзолевой фракции на установки каталитического крекинга, мощности установок каталитического крекинга КК-1, КК-2, поступление компонентов смешения изооктана, толуола, этиловой жидкости, а также плановые задания по выпуску Б-95/130. Рассматривалось разбиение выборочного пространства на восемь классов, где семь классов соответствуют несовместностям, вызванным указанными причинами, а 1 класс — класс допустимых решений. В качестве алгоритма обнаружения источника несовместности был выбран алгоритм минимизации [c.207]
Тип 2 прогноз (восстановление) неизвестных значений интересующих нас индивидуальных (Y (X) = (т] = X)) или средних (Уср (X) = Е (г = X) значений исследуемых результирующих показателей по заданным значениям X соответствующих (предикторных) переменных. При такой постановке задачи статистический вывод включает в себя описание интервала (области) Ар (X) вероятных значений прогнозируемого показателя Уср (X) или Y (X) и сопровождается величиной доверительной вероятности Р, с которой гарантируется справедливость нашего прогноза, формализуемого с помощью утверждения вида (Y (X) g Ар (X) или Уср (X) Лр (X) . Как и в предыдущем случае, выбор формы связи (т. е. класса допустимых решений F и конкретного вида функции f (X) в модели (В.З)) и состава предикторов X играет подчиненную роль и нацелен исключительно на минимизацию ошибки получаемого прогноза. Однако в данном случае (в отличие от предыдущего) исследователь существенно использует значения функции f (X), которые являются отправной точкой при построении прогнозных интервалов (областей) АР(Х). Последние обычно определяются в форме множества всех тех значений Y, которые удовлетворяют неравенствам [c.20]
Весь процесс статистического исследования зависимостей может быть разбит на семь последовательно реализуемых основных этапов, хронологический характер связей которых дополняется связями итерационного взаимодействия (см. рис. В.8) этап I (постановочный) этап 2 (информационный) этап 3 (корреляционный анализ) этап 4 (определение класса допустимых решений) этап 5 (анализ мультиколлине-арности предсказывающих переменных и отбор наиболее информативных из них) этап 6 (вычисление оценок неизвестных параметров, входящих в исследуемое уравнение статистической связи) этап 7 (анализ точности полученных уравнений связи). [c.55]
Соотношение истинной (/ (X)), теоретической аппроксимирующей (fa (X)) и выборочной аппроксимирующей (fa (X)) регрессий существенно зависит от выбора критерия адекватности Д (fa) (определяемого природой регрессионных остатков е) и класса допустимых решений F. В частности, даже при удачном выборе критерия адекватности Д в ситуациях, когда истинная функция регрессии / (X) не накрывается классом допустимых решений F (т. е. когда / (X) Ё F), выборочная аппроксимирующая функция регрессии fa (X) не будет стремиться к истинной при неограниченном росте объема выборки (отсутствие свойства состоятельности у fa (X), объясняемое неустранимостью ошибки аппроксимации). [c.174]
Компромисс между сложностью регрессионной модели и точностью ее оценивания1. Из общих результатов математической статистики, относящихся к анализу точности оценивания исследуемой модели при ограниченных объемах выборки, следует, что с увеличением сложности модели (например, размерности неизвестного векторного параметра в, участвующего в ее уравнении) точность оценивания падает. Мы с этим уже сталкивались, например, при анализе точности оценивания частных и множественных коэффициентов корреляции (см. п. 1.2.3, 1.3.3, а также формулы (1.34), (1.34 )). Об этом же свидетельствуют и результаты, приведенные в гл. 11. Это означает, в частности, что в ситуациях, когда исследователь располагает лишь ограниченной исходной выборочной информацией, он вынужден искать компромисс между степенью общности привлекаемого класса допустимых решений F и точностью оценивания, которой возможно при этом добиться. [c.190]
В изложении материала п. 6.3.1, связанного с понятием емкости (сложности) класса допустимых решений Рис методом структурной минимизации критерия адекватности, участвовал В. Н. Вапник. [c.190]
Опишем теперь, следуя [34], общую схему, в рамках которой решается задача выбора оптимальной сложности параметрического семейства / (X в) , используемого в качестве класса допустимых решений F, в зависимости от объема п и геометрической структуры исходных данных (6.7). Общая логика, на которой построена эта схема, та же, что и логика решения предыдущей задачи и та, и другая опираются на умение дать гарантированную оценку оптимизируемой теоретической характерис- [c.192]
Важную роль в правильном выборе параметрического класса допустимых решений играет предварительный анализ геометрической структуры совокупности исходных данных и в первую очередь анализ геометрии парных корреляционных полей, включающий в себя, в частности, учет и формализацию гладких свойств искомой функции регрессии, использование вспомогательных линеаризующих преобразований. [c.207]
Сформулированные с помощью содержательного и геометрического анализа рабочие гипотезы об общем виде искомой функции регрессии могут быть проверены с привлечением соответствующих матгматико-статистических критериев. Среди фундаментальных идей, на которых базируются эти статистические критерии, следует выделить а) идею компромисса между сложностью регрессионной модели ( емкостью класса допустимых решений) и точностью ее оценивания б) идею поиска модели, наиболее устойчивой к варьированию состава выборочных данных, на основании которых она оценивается в) идею проверки гипотез об общем виде функции регрессии на базе сравнения выборочных критериев адекватности и исследования статистических свойств получаемых при этом оценок размерности модели. [c.207]
В любом случае применение точных методов решения задачи назначения для больших размеров используемых графов является проблематичным либо из-за их большой сложности, либо из-за чересчур узкого класса допустимых графов. Поэтому большое распространение получили приближенные методы. Эти методы также можно разделить на специализированные (рассчитанные на ограниченный класс графов алгоритмов и/или ВС) и универсальные. К первым относится семейство методов, описанных в [80] и предназначенных для решения ряда задач с ограничениями и на граф алгоритма и на граф ВС. Описывается процедура Probe, которая для заданного числа а определяет, существует или нет назначение, значение функционала на котором меньше или равно а. Если такое отображение существует, то оно строится. Далее определяется отрезок [, .у], в котором [c.145]
Достаточно исчерпывающие и теоретически обоснованные ответы на эти вопросы мы в состоянии дат лишь в рамках схемы, постулирующей, что а) выбор класса F допустимых решений (т. е. выбор общего параметрического вида функции регрессии / (X)) осуществлен удачно, а именно / (X) 6 F б) рмеется априорная информация о вероятностной природе чнапример, о типе закона распределения) регрессионных ос- [c.335]
Первое уравнение каждой из систем (при целочисленных ограничениях на переменные) определяет симметрию л-вершинного графа. Второе уравнение определяет симметрию редуцированного на одну вершину, т.е. (л-/)-вершинного графа. Наличие решений у какой-либо системы показывает симметрические атрибуты обоих графов - число классов полюсов, кратность полюсов и их число в каждом классе. Эти атрибуты полностью определяют симметрию графов [5]. Зная число вершин графов, можно по их симметрии восстановить множество структур (графов), обладающих найденными атрибутами. Результаты показали, что формальные решения существуют только для систем 1), 2) и 3). Их анализ выявил, что допустимыми решениями обладает только система 1). Графы, имеющие найденные симметрические атрибуты, имеют следующую структуру n-вершинный граф с циклической подгруппой симметрии порядка п, редуцированный на одну вершину, становится (л-/) -вершинным графом с циклической подгруппой симметрии порядка п-1. Этим решениям соответствуют, так называемые, графы циркулянты при специальном порядке отождествления ребер в редуцируемой вершине [7]. Таким образом, единственным допустимым решением всех четырех систем диофантовых уравнений оказались графы-циркулянты, рис.1. [c.244]