Анализ многомерных совокупностей. Набор методов для наглядного представления относительного положения конкурирующих товаров или марок. Объекты представляются точками в многомерном пространстве признаков, в котором расстояние между точками определяется степенью различия изображаемых ими объектов. [c.187]
В этой главе мы познакомились со вторым из двух главных типов обучения - обучением без учителя. Этот режим обучения чрезвычайно полезен для предобработки больших массивов информации, когда получить экспертные оценки для обучения с учителем не представляется возможным. Самообучающиеся сети способны выделять оптимальные признаки, формируя относительно малоразмерное пространство признаков, без чего иногда невозможно качественное распознавание образов. Таким образом, оба типа обучения удачно дополняют друг друга. Кроме того, как мы убедились на примере сетей с узким горлом, между этими типами обучения существует тесная взаимосвязь если посмотреть на ситуацию под определенным углом зрения соответствующие правила обучения подчас просто совпадают. [c.87]
Формирование оптимального пространства признаков [c.143]
Один из наиболее очевидных способов формирования пространства признаков с учетом реальной значимости входов - постепенный подбор наиболее значимых входов в качестве очередных признаков. В качестве первого признака выбирается вход с наибольшей индивидуальной значимостью [c.143]
Подсчитав индивидуальную значимость входов находим направление в исходном входном пространстве, отвечающее наибольшей (нелинейной) чувствительности выходов к изменению входов. Это градиентное направление определит первый вектор весов дающий первую компоненту пространства признаков [c.144]
Как иллюстрирует Рисунок 5, увеличение ширины окна погружения ряда приводит в конце концов к понижению предсказуемости - когда повышение размерности входов уже не компенсируется увеличением их информативности. В этом случае, когда размерность лагового пространства d слишком велика для данного количества примеров, приходится применять специальные методики формирования пространства признаков с меньшей размерностью. Способы выбора признаков и/или увеличения числа доступных примеров, специфичные для финансовых временных рядов будут описаны ниже. [c.152]
Формирование пространства признаков [c.153]
Обратите внимание, что использование ортогонального пространства признаков привело к некоторому повышению предсказуемости по сравнению с обычным способом погружения с 0.12 бит (Рисунок 5) до 0.17 бит (Рисунок 8). Чуть позже, когда пойдет речь о влиянии предсказуемости на прибыль, мы покажем, что за счет этого норма прибыли может увеличиться почти в полтора раза. [c.156]
Анализ многомерных совокупностей. Набор методов для наглядного представления относительного положения конкурирующих товаров или марок. Объекты представляются точками в многомерном пространстве признаков, в котором расстояние между точками определяется степенью различия изображаемых ими объектов. Пример. Производитель компьютеров может проанализировать место, занимаемое его маркой на рынке, по отношению к маркам-конкурентам. [c.141]
Целью кластерного анализа является выделение в исходных многомерных данных таких однородных подмножеств, чтобы объекты в середине групп были подобны одно другому, а объекты разных групп - неподобны. Под сходством в данном случае понимается близость объектов в многомерном пространстве признаков, и задача сводится к выделению в этом пространстве натуральных сосредоточений объектов (кластеров), которые и считаются однородными группами. [c.262]
Осуществляется аппроксимация полученного нечеткого отношения в пространстве признаков и критериев. [c.65]
Упорядочение большого числа сложных терминов, включающих слово надежность, и разъяснения наиболее важных из них. Признание необходимости классификации свойства надежности в многомерном пространстве признаков, таких как вид объекта, стадия его жизненного цикла , режим объекта, заблаговременность оценки (расчета) показателей, вид энергоресурса и др. Разработка рекомендуемых для применения терминов в этом пространстве. [c.356]
На этом принципе построено довольно много методов обобщения понятий, которые можно было бы назвать методами разделения в пространстве признаков. В простейшем случае ситуация, показанная на рис. 4.1, обобщается на пространство произвольной размерности и строятся методы выделения наиболее крупных скоплений объектов, для которых расстояния между признаками значительно меньше расстояний между отдельными скоплениями. На этой идее основано большинство методов, развиваемых в рамках кластерного анализа. [c.168]
Обобщением такого подхода к образованию понятий служит идея использования специальной функции для выделения ядер из заданного множества объектов. Эта функция может быть построена различными способами. Например, она может принимать на объектах, входящих в ядро, значения, значительно превосходящие значения той же функции в некоторой окрестности пространства признаков, окружающей ядро. Эти функции как бы задают распределение потенциалов в пространстве признаков, почему и сам метод работы с такими функциями получил название метода потенциальных функций. [c.168]
Однако подобные методы, основанные на использовании лишь сведений о пространстве признаков и некоторых его свойствах, многократно исследованные в теории распознавания образов, почти ничего не дают для решения задачи формирования понятий, возникающей в теории ситуационного управления и родственных ей подходов к решению проблемы целесообразного управления объектом, И связано это с тем, что в таких условиях мы всегда имеем некоторую априорную информацию о конкретных представителях, входящих в формируемое понятие. Иными словами, мы заранее знаем, что некоторые объекты аг должны входить в формируемое понятие (положительные примеры), а другие аг не должно входить в него (отрицательные примеры). Это приводит к постановке задачи обобщения по признакам на основе обучающей выборки, состоящей из положительных и отрицательных примеров. Именно такие задачи мы и будем изучать ниже в данной главе. [c.168]
Поясним его на примере двух признаков, приписываемых объектам аг. Это позволит нам проиллюстрировать идею метода геометрически, что обеспечивает необходимую наглядность. При реализации метода гиперплоскостей для произвольного числа признаков нужно произвести прямой перенос всех процедур с двумерного случая на n-мерный. Итак, пусть мы имеем некоторое множество объектов A= at , элементы которого обладают двумя признаками яг и я2, принимающими значения из некоторых множеств П1 и ПА Для простоты будем считать, что П1 и П2 — определенные отрезки на оси действительных чисел. Тогда все объекты а,-в пространстве признаков находятся внутри некоторого прямоугольника. Одну из его вершин мы примем, за начало координат. Рассмотрим ситуацию, показанную на рис. 4.2. На нем [c.169]
Имеется еще группа методов, в которых вместо простого разделения в пространстве признаков используются метрические функции этого пространства. Например, группировка объектов в новое понятие происходит таким образом, что расстояния между парами объектов, попавших в одно понятие, существенно превосходят расстояние от них до объектов, лежащих вне его (разделение по потенциальной функции). [c.170]
Указанный недостаток, несмотря на простоту процедур формирования понятий по методу разделения в пространстве признаков, делает эти методы мало пригодными для задач ситуационного управления. Именно поэтому в системах ситуационного управления, как правило, используются другие принципы формирования понятий и организации классификации. [c.171]
Сущность этих новых принципов, лежащих в основе многомерной классификации, состоит в следующем. Классификация объектов производится не последовательно по отдельным признакам, а одновременно по большому числу признаков. Этот фиксированный набор признаков образует так называемое пространство признаков, а каждому признаку придается смысл координаты. Если задано m существенных признаков совокупности, то любой объект рассматривается как точка в m-мерном пространстве признаков и задача классификации сводится к выделению сгущений объектов в этом пространстве. Для этого используются разные алгоритмы, но всегда группы (типы, классы) формируются на основании близости объектов по комплексу признаков. [c.36]
Подходы к формированию групп, применяемые в многомерной группировке, лучше, чем комбинационные, согласуются со сложившимся представлением о существовании естественных типов объектов, близких по совокупности признаков. В самом деле, при комбинационной группировке объект, отклоняющийся по одному-единственному признаку от нормы, характерной для группы, будет автоматически из нее исключен. Более того, если этот признак используется на первом шаге группировки, то объект может легко попасть в группу, очень далекую от той, с которой он в действительности имеет наибольшее сходство. Если вспомнить понятие пространства признаков, то группы, получаемые при комбинационной группировке, представляют собой секторы такого пространства. При этом границы между ними обычно параллельны осям данного пространства и жестко заданные интервалы признаков часто разрушают реально существующие классы. Этот основной недостаток делает комбинационные группировки не всегда эффективными для выделения типов объектов по комплексу признаков, так как с добавлением каждого нового признака опасность разрушения объективно существующих однородных групп возрастает. [c.36]
Основные принципы измерения в социологии. Представление о признаке в социологии, пространство признаков. [c.150]
Кластерный анализ применяется в том случае, когда исследователь не располагает обучающими выборками и имеет лишь т подлежащих классификации наблюдений Х(, Х2,..., Хт в -мерном пространстве признаков. Сточки зрения априорной информации об окончательном числе классов, на которое требуется разбить исследуемую совокупность объектов, задачи кластер-анализа можно подразделить на два основных типа [c.399]
Основной идеей, на которой строится кластерный анализ, является определение взаимного расположения (степени близости) объектов в w-мерном пространстве признаков. Результатом реализации кластер-процедуры является разделение исследуемой совокупности на заранее известное либо определяемое в ходе анализа число однородных классов. [c.400]
Поточное производство имеет несколько разновидностей, различающихся характером движения предмета труда, постоянством и широтой номенклатуры продукции, охватом операций, фаз производственного процесса и др. Эти признаки лежат в основе классификации разновидностей поточного производства, что находит свое конкретное выражение в классификации поточных линий. При их группировке следует иметь в виду, что все процессы осуществляются в пространстве и во времени, поэтому необходимо учитывать две группы признаков. [c.34]
ПРОФЕССИОНАЛЬНАЯ СТРАТИФИКАЦИЯ — разделение профессиональных групп на слои по какому-либо признаку. Часто используется семичастная вертикальная П.с. а) высший класс профессионалов, администраторов б) технические специалисты среднего уровня в) коммерческий класс г) мелкая буржуазия д) техники и рабочие, осуществляющие руководящие функции е) квалифицированные рабочие ж) неквалифицированные рабочие. Среди менеджеров, напр., выделяют супервайзеров и топ-менеджеров. П.с. включается в качестве одной из осей обобщенной многомерной стратификации (профессия, доход, образование, жилище и др.), являющейся геометрической моделью, условно представляющей соц. пространство. [c.287]
Информация подвергается ряду операций в технологическом процессе управления, среди которых фиксация на носитель, хранение в виде данных , передача в пространстве по каналам связи и преобразование, сортировка по заданному признаку, поиск места хранения информации, обработка, контроль степени достоверности и своевременности, уничтожение. Перечень этих операций отражает жизненный цикл информации. [c.301]
Дальнейшим развитием метода дифференциального исчисления явился метод дробления приращений факторных признаков, при котором следует вести дробление приращения каждой из переменных на достаточно малые отрезки и осуществлять пересчет значений частных производных при. каждом (уже достаточно малом) перемещении в пространстве. Степень дробления принимается такой, чтобы суммарная ошибка не влияла на точность экономических расчетов. [c.128]
Каждая единица совокупности в кластерном анализе рассматривается как точка в заданном признаковом пространстве. Значение каждого из признаков у данной единицы служит ее координатой в этом пространстве по аналогии с координатами точки в нашем реальном трехмерном пространстве. Таким образом, признаковое пространство - это область варьирования всех признаков совокупности изучаемых явлений. Если мы уподобим это пространство обычному пространству, имеющему евклидову метрику, то тем самым мы получим возможность измерять расстояния между точками признакового пространства. Эти расстояния называют евклидовыми. Их вычисляют по тем же правилам, как и в обычной евклидовой геометрии. На плоскости, т.е. в двухмерном пространстве, расстояние между точками А и В равно корню квадратному из суммы квадратов разностей координат этих точек по оси абсцисс и по оси ординат - на основании теоремы Пифагора (рис. 6.1). [c.136]
Снижение размерности пространства признаков путем перехода к главным компонентам позволяет наглядно визуализировать возможное группирование объектов по каким-либо признакам, выявить причины такой группировки, а также определить факторы, влияющие на ход технологического процесса. Результаты такого анализа позволяют выработать не-гмые мероприятия для воздействия на технологический процесс с его совершенствования. В качестве исходных данных для анализа с главных компонент могут использоваться режимные параметры работы конкретных производственных установок [c.185]
Кластерный анализ — один из методов многомерного анализа, предназначенный для группировки (кластеризации) совокупности, элементы которой характеризуются многими признаками. Значения каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризу- [c.130]
Методы предобработки сигналов и формирования относительно малоразмерного пространства признаков являются важнейшей составляющей нейроанализа и будут подробно рассмотрены далее в отдельной главе. [c.66]
Для определения значимости входов нам потребуется оценить предсказуемость выходов обеспечиваемую данным набором входных переменных. Чем выше эта предсказуемость - тем лучше соответствующий набор входов. Таким образом метод box- ounting предоставляет в наше распоряжение технологию отбора наиболее значимых признаков для нейросетевого моделирования, технологию оптимизации входного пространства признаков. [c.141]
Приведенные ниже результаты вычисления предсказуемости индекса S P500 методом box- ounting (см. Рисунок 7, Рисунок 8) иллюстрируют роль искусственных примеров. Пространство признаков в данном случае формировалось методом ортогонализэции, описанным в главе о способах предобработки данных. В качестве входных переменных использовались 30 главных компонент в 100-мерном лаговом пространстве. Из этих главных компонент были выбраны 7 признаков - наиболее значимые ортогональные линейные комбинации. Как видно из этих рисунков, лишь применение искусственных примеров оказалось способным в данном случае обеспечить заметную предсказуемость. [c.156]
Возникает естественный вопрос "А зачем вообще нужна нейронная сеть для данного алгоритма " Ведь он может просто использовать обучающую выборку - известно же, какому классу принадлежит каждый пример. Более того, как бы хорошо ни была обучена сеть, она все равно будет делать ошибки, неправильно классифицируя некоторые примеры. Дело в том, что именно использование нейросетей в качестве Оракула дает возможность получать деревья решений, имеющих более простую структуру, чем у деревьев, обученных на исходных примерах. Это является следствием как хорошего обобщения информации нейронными сетями, так и использования при их обучении операции исправления данных ( LEARNING). Кроме того, алгоритмы построения деревьев, исходя из тренировочного набора данных, действительно разработаны и с их помощью такие деревья строятся путем рекурсивного разбиения пространства признаков. Каждый внутренний узел подобных деревьев представляет критерий расщепления некоторой части этого пространства, а каждый лист дерева - соответствует классу векторов признаков. Но в отличие от них TREPAN конструирует дерево признаков методом первого наилучшего расширения. При этом вводится понятие наилучшего узла, рост которого оказывает набольшее влияние на точность классификации генерируемым деревом. Функция, оценивающая узел п, имеет вид F(n) = r(n)( - f(n)), где r(ri) - вероятность достижения [c.181]
Метод, проиллюстрированный в примере 4.1, в свое время М. М. Бонгард назвал развал на кучи . В методах такого типа предполагается, что структура признаков выбрана столь удачно, что в пространстве признаков объекты, образующие некоторое понятие, группируются компактным образом. Они как бы сгущаются около некоторого ядра , характеризующего наиболее существенные для данного признака комбинации их значений. [c.168]
Собственно проблеме фэрмировния понятий так, как она понимается в задачах распознавания образов и понималась на первом этапе развития теории искусственного интеллекта, посвящено огромное количество работ. Сошлемся прежде всего на источники, уже упоминавшиеся ранее, где обсуждаются эти проблемы в рамках, близких к задачам данной книге [1.1. 1.11, 2.16]. Упомянем еще две монографии Э. Ханта [4.11, 4.12], который много занимался проблемой формирования понятий. В 4.3 мы использовали прежде всего методы разделения в пространстве признаков, описанные, например, в [4.13]. Монографию [4.14] можно использовать для ознакомления с процедурами порождения новых методов, в которых разделение осуществляется на основе значений некоторой специально конструируемой функции фу (см. 4.3). Наконец, методы кластерного анализа, о которых в этой [c.264]
Анализ рынка недвижимости является непростым делом. Подход с использованием СОК чрезвычайно полезен для сравнения и оценки земельной собственности. Выявление собственности, обладающей необходимыми характеристиками (компонентами), или самих этих компонент является наиболее существенным для получения ясной картины поведения рынка. Огромное количество различной информации может быть получено из ряда общедоступных баз данных, заключающих в себе внушительную сумму имеющегося опыта и знаний по данному вопросу. Тем не менее поведение рынка может быть понято только при соответствующей организации наблюдений. Распределение имеющихся примеров в пространстве признаков характеризуется нерегулярностью, наличием нелинеиностеи и неодно-родностей. Однако разбираться в ситуациях и соответствующих друг другу компонентах, выделяя при этом множество нестандартных случаев, чрезвычайно важно. Эта глава показывает, каким образом разнообразные компоненты могут быть масштабированы в зависимости от поставленных целей. С помощью СОК можно также выявлять нетипичные объекты и компоненты. [c.183]
Интенсификация труда отличается от технической интенсификации также и по признаку инициирования, субъекта действия. Если в случае с технической интенсификацией субъект и объект действия разделены в пространстве на активную (человек) и пассивную (средства производства) стороны, то в случае с интенсификацией труда дело обстоит по-другому. Здесь и субъект, и объект действия сливаются в одном лице, в самом человеке. Такой вариант интенсификации вполне правомерно назвать самоинтенсификацией. [c.146]
Начиная с 40 г. XX века инженерная практика и науковедение выработали несколько десятков методов направленного продвижения к эффективной конструкции или технологии. Самым распространенным и, видимо, самым эффективным из них стал морфологический анализ. Это способ представления внутреннего строения множества возможных технологий или конструкций посредством их многомерной классификации по наиболее важным признакам. Например, множество возможных способов крепления заготовки может быть представлено механическим, электродинамическим, пневматическим, гидравлическим, магнитным способами. Множество потенциальных способов бурения включает роторный, турбинный, ударный, гидравлический, гидроударный, электроискровой, плазменный, лазерный. После упорядочения пространства инженерных решений перспективность каждого блока морфологической таблицы оценивается с помощью руководящего методологического принципа типа (5.8) и с применением тривиального экономического критерия, например, себестоимости 1 метра проходки скважин. Может выявиться рассогласование результатов, полученных первым и вторым способами. Именно оно должно быть предметом пристального анализа. Дело в том, что расчет текущей себестоимости (в данном случае 1 метра проходки) выявил преимущество турбинного бу- [c.130]
Для систем полиэрготического типа основными классификационными признаками являются [16, 44] 1) степень сложности-2) характер функционирования 3) вид связи операторов с объектом управления 4) назначение системы 5) характер изменения координат в пространстве 6) задачи, решаемые человеком и т. д. [c.158]