ПОИСК
Это наилучшее средство для поиска информации на сайте
Психологические предпосылки
из "Ситуационное управление теория и практика "
Некто X, большой начальник, говорит подчиненным Я считаю, что должность А должен занять генерал в отставке в возрасте около 60 лет . Один из подчиненных радостно восклицает, что он знает такого человека. Но X явно недоволен. Идиот,— шепчет на ухо выступившему его сосед,— он просто хочет посадить на это место своего приятеля . [c.17]Существует еще несколько особенностей объектов нового типа, с которыми теория управления начала сталкиваться с конца пятидесятых годов нашего столетия. Но и сказанного, по-видимому, вполне достаточно для того, чтобы оценить необходимость в новом подходе к объекту управления при попытке создать систему, управляющую им. Но прежде чем мы перейдем к описанию, возможных путей решения этой проблемы, нам нужно совершить экскурс в психологию мышления. [c.17]
Психологи много внимания уделяли проблеме исследования поведения человека при решении возникающих перед ним задач. Было создано немало концептуальных схем, объясняющих особенности его поведения при решении различных по своему характеру задач. Рассмотрим три такие схемы, получившие наиболее широкое распространение и представляющие для нас интерес в рамках нашей книги. [c.17]
В психологии такой подход к изучению поведения человека носит название бихевиоризма. Он справедливо подвергся критике, ибо сводит весь процесс решения проблемы к методу проб и ошибок с постепенным накоплением вероятностной информации о целесообразном поведении в данной ситуации. Тем ие менее ряд систем управления может быть построен на основе этой весьма грубой теории. Ограничимся для иллюстрации этого утверждения всего одним примером. [c.17]
Точное решение в лабиринтной модели достигается только тогда, когда удается проанализировать весь лабиринт. Пример такого положения — игра в крестики-нолики на поле 3x3. Недаром ею увлекаются малыши. Они еще не сообразили, что можно априорно проанализировать все пути развития игры и всегда выигрывать, если противник допускает ошибку. При безошибочной игре крестики-нолики всегда заканчиваются ничьей. [c.19]
Малые конечные лабиринты приводят к модели решения задачи, имитируемой конечными автоматами. Любая площадка лабиринта соответствует некоторому состоянию автомата, а коридоры — переходам автомата из состояния в состояние под воздействием входного сигнала и с учетом того состояния (той площадки лабиринта), где автомат сейчас находится. Входной сигнал имитирует те решения, которые принимает ЛПР при выборе коридора лабиринта. При этом ЛПР может создать систему управления объектом также в виде некоторого конечного (детерминированного или вероятностного) автомата. Подобная схема управления показана на рис. 1.3. [c.19]
На нем V и V отражают обратные связи, характеризующие память автоматов, имитирующих объект управления и систему управления. Если ЛПР структура автомата, имитирующего-объект, полностью известна (т. е. известен автоматный граф смены состояний п формирования выходных сигналов), то обратная связь от объекта к системе управления не нужна. Поэтому она показана штриховой линией. [c.19]
Необходимость в ней возникает только тогда, когда в процессе работы нужно производить настройку автомата, имитирующего систему управления, из-за неполного априорного знания об объекте управления. По сравнению со схемой на рис. 1.1 здесь нет входов, характеризуемых вектором W. Это соответствует тому, что в лабиринтной теории поведения предполагается, что влияние этих не поддающихся измерению параметров можно описать некоторой вероятностной схемой связи между вектором (X, W) и вектором Y. [c.20]
Как следует из рис. 1.3, мы предполагаем, что имитирующий автомат и объект описываются одинаковыми (с точностью до вероятностных реализаций) процессами функционирования. Другими словами, схема эта как бы обратима. И подопытное животное может рассматривать себя в качестве экспериментатора, устанавливающего условный рефлекс у истинного экспериментатора (ЛПР). Ситуация эта хорошо отражена в следующем анекдоте. [c.21]
Однако в большинстве практически интересных случаев ЛПР не стремится к тому, чтобы система управления имитировала объект управления. В этом нет никакой необходимости. Как правило, систему управления можно сделать проще объекта, которым она управляет. [c.21]
Например, нетрудно показать, что с усложнением объекта имитации — с переходом от простейшей схемы условного рефлекса к цепочкам таких рефлексов и сетям условных рефлексов, способным моделировать весьма сложные поведенческие акты,— система управления, воспроизводящая их особенности, останется таким же конечным автоматом, который был использован в примере 1.2. [c.21]
Для устранения различий в рассматриваемой игре можно использовать операторы четырех типов сдвинуть на свободное поле нижнюю, верхнюю, левую, правую фишки. В конкретной позиции можно использовать не все операторы. При свободном поле в середине — три из четырех, а при свободном угловом поле — два из четырех. Выбор того или иного оператора определяется их приоритетностью. Приоритетность, в свою очередь, определяется тем, насколько данный оператор уменьшает различие. Например, в той позиции, которая изображена на рис. 1.5. нет смысла двигать фишку с номером 5 (применять оператор сдвинуть на свободное поле нижнюю фишку --), так как это приведет к увеличению различия. Применение же операторов сдвинуть на свободнее поле левую фишку и сдвинуть на свободное поле правую фишку здесь равноправно. Применение любого из них уменьшает отличие данной позиции от целевой на одну единицу. [c.22]
Для поиска глобального экстремума в теории оптимизации придумано немало приемов изменение градиентного шага, движение вдоль оврага и т. п. В системах типа ОРЗ также построены некоторые приемы улучшения планов решения. Например, переход от исходного лабиринта к более простому, более грубому. Планирование движения сначала по нему, а потом уточнение этого плана на исходном лабиринте, причем при монотонности грубого плана уточненный план может стать немонотонным. Но, к сожалению, пока не удалось найти хорошие процедуры для построения грубых планов. А пока это не сделано, нельзя надеяться на построение хороших моделей принятия решений. [c.23]
Но у лабиринтной теории есть куда более важный недостаток, чем свойство монотонности, присущее практически всем процедурам движения по лабиринту. Этот недостаток заключается в априорной заданное лабиринта или способа его построения. Но откуда берутся эти сведения В терминах, принятых в п. 1.1, это означает, что ЛПР знает / и ему нужно лишь построить процедуру управления. Но мы уже говорили, что создание описания объекта управления — задача не только более сложная, чем нахождение самой процедуры управления, но и не имеющая пока каких-либо стандартных приемов решения. [c.23]
Вернуться к основной статье